Bài giảng tin ứng dụng Gv: Trần Trung Hiếu Bộ môn CNPM – Khoa CNTT Email: tthieu@hua.edu.vn Website: http://fita.hua.edu.vn/tthieu
Chương II: Các hàm thống kê Các hàm thống kê (Statistical Functions) Giới thiệu một số hàm thống kê
Chương II: Các hàm thống kê Bấm nút fx trên ToolBar hoặc chọn Menu Insert/Function xuất hiện hộp thoại Ở Function category chọn Statistical
Chương II: Các hàm thống kê 2. Giới thiệu một số hàm thống kê Average, Max, Min, Count, CountA Var, Stdev Correl, Covar Finv Tinv Frequency Linest
Giới thiệu một số hàm thống kê Average, Max, Min, Count, CountA Average, Max, Min (đã học trong tin ĐC) Count: Đếm số lượng các ô có giá trị kiểu số trong miền và các giá trị số trong danh sách biến Cú pháp: COUNT(value1,value2,...) value1, value2…có thể là địa chỉ miền, địa chỉ ô hay một giá trị bất kỳ. Ví dụ: COUNT(1,"A",a,2, A3, A2:B3) CountA: Đếm số lượng các ô không trống trong miền và các giá trị trong danh sách biến Cú pháp: COUNTA(value1,value2,…) Ví dụ: COUNTA(1,"A",a,2, A3, A2:B3)
Giới thiệu một số hàm thống kê 2. VAR, STDEV Trong xác suất, xét đại lượng ngẫu nhiên X Tiến hành n phép thử được các giá trị ngẫu nhiên: x1, x2, …xn căn cứ vào kết quả phép thử, dựa vào kiến thức xác suất tính toán các đại lượng từ đó đưa ra các kết luận, dự báo. Kỳ vọng M(X): đặc trưng cho giá trị trung bình của lượng ngẫu nhiên Phương sai mẫu D(X) hay độ lệch chuẩn σ(X) đặc trưng cho độ phân tán các giá trị của DLNN xung quanh giá trị trung bình Công thức ước lượng để tính phương sai: Độ lệch chuẩn được tính theo công thức:
Giới thiệu một số hàm thống kê 2. VAR, STDEV (tiếp) Trong Excel Tính phương sai sử dụng hàm VAR (variance) Cú pháp: VAR(number1,number2,...) number1, number2… có thể là địa chỉ ô, địa chỉ miền hay một giá trị của biến ngẫu nhiên X Tính độ lệch chuẩn sử dụng hàm STDEV (standard deviation) Cú pháp: STDEV(number1,number2,...)
Giới thiệu một số hàm thống kê 3. Correl, Covar Trong xác suất Khi nghiên cứu đồng thời cặp lượng ngẫu nhiên (X,Y) ngoài các đặc trưng kỳ vọng, phương sai của X, Y ta còn phải xét sự tương quan giữa chúng dùng hiệp phương sai cov(X,Y) hay hệ số tương quan ρxy để xét sự tương quan Trong giải tích có kiểu liên hệ hàm số giữa 2 đại lượng biến thiên X vày Y (chẳng hạn giữa diện tích Y và bán kính X của đường tròn Y=πX Khi khảo sát các đại lượng ngẫu nhiên không độc lập X, Y ta thấy chúng cũng có liên hệ với nhau nhưng kiểu liên hệ đó không phải kiểu liên hệ hàm số Ví dụ: Giữa lượng phân bón X và sản lượng Y của một loại cây chúng có liên hệ nhưng ta không thể nói trước được giá trị của Y khi biết giá trị của X, mà sau khi làm nhiều thí nghiệm ta chỉ có thể nói với mức bón x thì trung bình sẽ thu được sản lượng y Đây gọi là kiểu liên hệ tương quan (hay liên hệ thống kê): mỗi giá trị của X có tương ứng một quy luật phân phối xác suất của Y Nếu X, Y độc lập thì hiệp phương sai bằng 0. Nếu hiệp phương sai # 0 ta nói rằng các đại lượng ngẫu nhiên X,Y không độc lập Giá trị tuyệt đối của hệ số tương quan <=1. Nếu trị tuyệt đối khá gần 0 thì coi như giữa X và Y không có tương quan tuyến tính, nếu khá gần 1 thì quan hệ giữa X và Y có thể coi là là tuyến tính (có thể biểu diễn Y=aX+b) Công thức ước lượng hiệp phương sai và hệ số tương quan
Giới thiệu một số hàm thống kê 3. Correl, Covar (tiếp) Trong Excel Tính hiệp phương sai sử dụng hàm COVAR (covariance) Cú pháp: COVAR(dãy_số_1,dãy_số_2) dãy_số_1,dãy_số_2 là các miền dữ liệu của các biến X, Y tương ứng Chú ý: dãy_số_1, dãy_số_2 phải là kiểu số Nếu giá trị trong dãy số khác kiểu số thì giá trị này được coi như giá trị 0 thay thế Nếu hai dãy số khác nhau về kích thước thì gặp lỗi #N/A Nếu một trong hai dãy rỗng thì gặp lỗi #DIV/0
Giới thiệu một số hàm thống kê 3. Correl, Covar (tiếp) Trong Excel Tính hệ số tương quan sử dụng hàm CORREL (correlation) Cú pháp: CORREL(dãy_số_1,dãy_số_2) dãy_số_1,dãy_số_2 là các miền dữ liệu của các biến X, Y tương ứng Chú ý: dãy_số_1, dãy_số_2 phải là kiểu số Nếu giá trị trong dãy số khác kiểu số thì giá trị này được coi như giá trị 0 thay thế Nếu hai dãy số khác nhau về kích thước thì gặp lỗi #N/A Nếu một trong hai dãy rỗng thì gặp lỗi #DIV/0
Giới thiệu một số hàm thống kê 4. Hàm FINV Trong xác suất: Qui luật phân phối xác suất Fisher Trong thực hành ta thường phải tìm số Fα với k1, k2 bậc tự do sao cho P(F> Fα )=α Fα gọi là nghịch đảo phân bố xác suất theo quy luật Fisher Ví dụ: Với α=0.05, k1=5, k2=10 tra trong bảng phân phối xác suất Fisher tìm được Fα =3.33 Có nghĩa P(F> 3.33 )=0.05 với bậc tự do k1=5, k2=10
Giới thiệu một số hàm thống kê 4. Hàm FINV (tiếp) Trong Excel: Để tìm số Fα ta sử dụng hàm FINV(α, k1, k2) α là mức xác suất k1, k2 là bậc tự do 1, bậc tự do 2 Ví dụ: Với α=0.05, k1=5, k2=10 dùng hàm FINV(0.05, 5,10) ta tính được Fα= FINV(0.05, 5,10) =3.33 Có nghĩa P(F> 3.33 )=0.05 với bậc tự do k1=5, k2=10
Giới thiệu một số hàm thống kê 5. Hàm TINV Trong xác suất đã học qui luật phân bố xác suất Student Trong thực hành thường phải tìm số tα với k bậc tự do sao cho: P(|t|> tα) = α Ví dụ: α=0.05, k=10 tra bảng tìm được tα=2.228: P(|t|>2.228)=0.05 Trong Excel để tìm tα ta sử dụng hàm TINV(α, k) α là mức xác suất k là bậc tự do Ví dụ: TINV(0.05, 10)=2.228
Giới thiệu một số hàm thống kê 6. Hàm FREQUENCY Hàm tính tần suất trên dãy số dựa theo miền phân tổ đã định Ví dụ
Giới thiệu một số hàm thống kê 5. Hàm FREQUENCY (tiếp) Cú pháp FREQUENCY(miền_số_liệu, miền_phân_tổ) Miền phân tổ được dùng để nhóm các số liệu thành một nhóm Cách sử dụng hàm Hàm FREQUENCY phải được sử dụng ở dạng ‘công thức mảng’ Cách làm: B1: Đặt con trỏ vào ô muốn hiển thị kết quả, sử dụng hàm một cách bình thường như các hàm khác B2: Xác định số trường hợp trả về của miền phân tổ B3: Chọn miền chứa kết quả bao gồm các ô theo chiều dọc, ô đầu tiên là ô vừa tính toán, số ô chọn bằng số trường hợp xác định ở bước 2. Thực hiện nhấn F2, sau đó Ctr+Shift+Enter để fill kết quả
Giới thiệu một số hàm thống kê 6. Hàm LINEST Trong xác suất: Xét một số hình ảnh về tính tương quan giữa 2 dãy số liệu có được qua khảo sát cặp biến ngẫu nhiên (X,Y) Nếu X, Y có quan hệ tuyến tính Y=aX+b thì có thể ước lượng các hệ số a, b theo công thức
Giới thiệu một số hàm thống kê 6. Hàm LINEST (tiếp) Trong Excel: Tính hồi quy tuyến tính giữa 2 dãy số liệu và cho kết quả dạng y=ax+b với m là hệ số hồi quy Y=a1x1+a2x2+…+anxn+b với mi là các hệ số hồi quy Cú pháp LINEST(tập_giá_trị_y, tập_giá_trị_x) Hàm cần được sử dụng ở dạng ‘công thức mảng’ (khác với hàm frequency, khi chọn miền, cần chọn các ô theo chiều ngang chứ không theo chiều dọc)