NỘI DUNG Chương 1: Giới thiệu môn học Chương 2: Phương pháp điều tra quan sát Chương 3: Xử lý, phân tích, đánh giá kết quả
Chương 1 Giới thiệu môn học Nội dung Mục tiêu môn học Các phương pháp thống kê trong nghiên cứu. Các khái niệm cơ bản trong thống kê Trình tự thực hiện điều tra.
I.Mục tiêu môn học Yêu cầu Mục tiêu: Thu thập và phân tích số liệu để khám phá/trả lời những vấn đề cần nghiên cứu. Đặc điểm: - diện rộng - đa biến – từ người khác. Yêu cầu Đầy đủ những thông tin cần thiết Chính xác – đúng đắn Ngẫu nhiên/khách quan. Tổ chức thực hiện có tính hệ thống => tiết kiệm thời gian, nhân lực và kinh phí
Các môn học và kỹ năng + Xác suất – thống kê + Kỹ năng giao tiếp + Tin học + Quan sát + Xác suất – thống kê + Kỹ năng giao tiếp + Toán học + Phân tích/tổng hợp
II. Các phương pháp thống kê trong nghiên cứu (Statistical methods in research) 1. Điều tra, quan sát (survey, observation) 2. Tiếp cận các nghiên cứu trước đó (historical approach) 3. Bố trí thí nghiệm (experimental design)
Ghi chú: Thống kê chỉ là phương tiện, dụng cụ, không phải là mục đích Ghi chú: Thống kê chỉ là phương tiện, dụng cụ, không phải là mục đích. Thống kê trình bày số liệu, hiện tượng rời rạc một cách hệ thống hơn, chứ không nói được gì về bản chất sự vật. Thống kê không thay thế được cho suy nghĩ và kết luận của người nghiên cứu . Thống kê là điều kiện cần, không phải là điều kiện đủ. (trích từ Phương pháp bố trí thí nghiệm và xử lý số liệu, T.S Phan hiếu Hiền, trang 3)
III. Các khái niệm cơ bản 1. Các mô hình xác suất thống kê - Biến (variables) (liên tục, rời rạc) - Hàm phân bố (chuẩn, rời rạc) 2. Các phương pháp thống kê mô tả - Phân bố thực nghiệm - Phân bố tần số
- Các đặc trưng - Số trung bình (mean, average) - Dân số (population) và mẫu (sample). - Số trung bình (mean, average) - Phương sai (variance) - Độ lệch chuẩn (standard deviation), - Hệ số biến động (coefficient of variance) - Biên độ biến động (range) Ghi chú: xem tài liệu”Thống kê ứng dụng và phương pháp thí nghiệm, TS Bùi việt Hải, trang 1-18).
Dân số (population) và Mẫu (sample) Dân số: là tập hợp tất cả các trị số của 1 đặc tính của 1 sự vật (xem tài liệu PPTN của Phan hiếu Hiền, trang 7) Mẫu: gồm 2 loại: mẫu chủ quan và mẫu ngẫu nhiên Mẫu chủ quan: chọn theo ý đồ định trước. Ví dụ: Chọn 12 người cao nhất để lập đội bóng chuyền. Mẫu chủ quan không có công dụng trong thống kê. Mẫu ngẫu nhiên: là mẫu được chọn sao cho các mẫu có cùng cỡ đều có cơ hội được chọn như nhau Ghi chú: Từ dân số => phân bố mẫu. Từ mẫu => suy đoán kết luận về dân số (do đó mẫu phải ngẫu nhiên, đầy đủ,chính xác).
Số trung bình (mean, average) Xtb = (f1X1+ f2X2+….+fnXn) / (f1+f2+…+fn) Ghi chú: Khi f1 = f2 = …..= fn = 1 => Xtb = (X1 + X2 + …. + Xn) / n
Phương sai và độ lệch chuẩn Phương sai (s2) S2 = SS/df = Σ (Xi – Xtb)2 / (n – 1) = ΣXi 2 –( Xi)2/n = 1/(n-1)* [ΣXi2 –(ΣXi)2/n] hoặc = 1/(n-1) * [Σ(fiXi)2 –(Σ fiXi)2/n] Độ lệch chuẩn (standard deviation) (Sd) Sd = √S2
Hệ số biến động, biên độ biến động Hệ số biến động (coefficient of variation) (Cv): là mức độ biến động bình quân tương đối của chỉ tiêu nghiên cứu. Cv (%) = 100 * Sd / Xtb Biên độ biến động ( R ) là khoảng chênh lệch giữa trị số lớn nhất và bé nhất của biến nghiên cứu. R = Xmax - Xmin
Ví dụ:Giá trị thu thập được như sau: (5, 6, 7, 4, 5, 6, 7, 7, 4, 9, 6) Giải: Xtb = (5+6+7+…9)/11 = 66/11 = 6 S2 = (1+0+…+9+0)/(11-1) = 2,2 S = (S2)1/2 = (2,2)1/2 = 1,485 Cv = 100 * 1,485 / 6 = 24,8% R = 9 – 4 = 5
Tính các giá trị đặc trưng (dùng Excel) Tools=>Data Analysis=>Descriptive statistic=>OK Input range: khối dữ liệu đầu vào Grouped by: theo cột (column)hay theo hàng (row) Confidence level for mean: 0,05 hay 0,01. K th largest: trị số quan sát lớn thứ K. K th smallest: trị số quan sát bé thứ K. Out put range: Khối dữ liệu đầu ra. Summary statistics: tóm tắt các đặc trưng thống kê. Chọn OK
T-test trong Excel Tools => Data Analysis => T-test Khai báo số liệu mẫu 1: Variable 1 range. Khai báo số liệu mẫu 2: Variable 2 range. Hypothesied mean difference: 0 (Ho = 0) Cho 1 cell trên cùng về phía trên để định khung output => kết quả.
Trình tự thực hiện điều tra 1. Thiết lập bài toán nghiên cứu. 2. Hệ thống hoá bài toán 3. Lập phương án (trực tiếp/gían tiếp) 4. Thiết kế mẫu (kiểu - số luợng) 5. Thu thập số liệu 6. Xử lý – phân tích số liệu 7. Đánh giá- kết luận
Sự tương đồng và khác biệt giữa CSĐT và môn học Thu thập thông tin (đầy đủ, chính xác) Khác (dị) biệt Về mặt tổ chức.(thường xuyên/không thường xuyên) Về đối tượng (tội phạm/công dân) Về hành động (cưỡng bức/tự do)
Chương 2 Phương pháp điều tra nghiên cứu Nội dung 1. Giới thiệu chung 2. Trình tự thực hiện Chọn đề tài (xác định mục tiêu/đối tượng) Thiết kế mẫu điều tra Tính số lượng mẫu điều tra Kỹ thuật lấy mẫu điều tra 3. Các yếu tố và các kỹ năng cơ bản 4. Tổ chức thực hiện
1. Giới thiệu chung Điều tra quan sát là sự ghi nhận các hiện tượng đã xảy ra trong thiên nhiên (thu thập số liệu) nhằm khám phá ra nguyên nhân và quy luật của chúng. Vì vậy => cẩn thận, nghiêm túc => đầy đủ, chính xác, trung thực, khách quan.
2. Các đặc tính chung - Khảo sát trên 1 số lượng mẫu nào đó (samples) thay vì toàn thể dân số (population) để tìm quy luật của chúng. - Nghiên cứu trên quy mô lớn (diện rộng, đa biến). - Chỉ ghi nhận những hiện tượng đã xảy ra chứ không tác động đến đối tượng nghiên cứu.
3a. Các yêu cầu cơ bản Đầy đủ thông tin cần thiết cho nghiên cứu Chính xác, đúng đắn, trung thực. Đơn giản, rõ ràng, dễ hiểu. Ngẫu nhiên, không chủ quan Thời gian thích hợp Có kỹ năng thích hợp.
3b. Các kỹ năng cơ bản * Óc quan sát (nhận biết/đánh giá sự kiện) * Kỹ năng giao tiếp (gây thiện cảm, rõ ràng nâng cao tính hợp tác v.v..) * Chuyên môn vững vàng (tránh thu thập thông tin không chính xác) * Tổ chức công việc (logic, lịch làm việc, thời gian, lộ trình di chuyển v.v…) Ghi chú: Sự khác biệt giữa công an điều tra xét hỏi và điều tra nghiên cứu.
a. Đặt vấn đề Mục tiêu nghiên cứu: - Từ thực tiễn/thực tế - Từ những nghiên cứu trước đó (lập lại) - Từ những ý tưởng mới (phát minh). Tiêu đề phải: - Rõ ràng - Đầy đủ chi tiết Để mọi thành viên có thể nắm rõ mục đích của cuộc điều tra. Ghi chú: Một số trường hợp đặc biệt, cần giữ bí mật mục đích chính xác của cuộc điều tra để tránh những câu trả lời thiên vị, lệch lạc.
b. Thiết kế mẫu điều tra Liệt kê tất cả các thành phần cần điều tra, (NDân, CB KT/quản lý, thương gia, lãnh đạo....) Liệt kê tất cả các yếu tố cần điều tra. (ví dụ: thông tin chung, kỹ thuật, kinh tế, hỗ trợ, dự án tương lai, phản ảnh/hồi v.v…). Các thông tin cần cho mỗi yếu tố. (ví dụ: trong kỹ thuật cần thông tin về đất đai, giống, phân bón, nước tưới, sâu bệnh v.v…) Các kiểu trả lời cho mỗi câu hỏi để thu thập thông tin (kiểu lựa chọn hay kiểu mở)
1 2 3 4 5 6 7 Xem xét tài liệu Lưu ý và các bước Chức năng Phương pháp và công cụ Lý thuyết và thiết kế Phương pháp, máy tính, thống kê Nguyên lý 1 2 3 4 5 6 7 Biến và giả thiết Định nghĩa và phân loại Thiết kế Tính xác thực và tin cậy Nội dung Kiểm tra tại hiện trường Hiệu chỉnh dữ liệu Mã hoá Xem xét tài liệu Phát triển sách mã
1. Xác định đối tượng nghiên cứu Xác định lãnh vực rộng (tầm vĩ mô) Xác định lãnh vực hẹp (tầm vi mô) Xác định mục tiêu cụ thể (chính/phụ) Xác định tính khả thi (khả năng thực hiện được mục tiêu nghiên cứu)
2. Thiết kế mẫu điều tra Các phương pháp thu thập dữ liệu Dữ liệu sơ cấp Dữ liệu thứ cấp Tư liệu Các ấn bản của chính phủ Các nghiên cứu trước đây. Các mẫu tin cá nhân Quan sát Phỏng vấn (trực tiếp) Bảng câu hỏi (gián tiếp) Người tham dự Có cấu trúc Gửi qua bưu điện Người không tham dự Không có cấu trúc Bảng câu hỏi dạng tập hợp
Phỏng vấn Phỏng vấn trực tiếp Phỏng vấn gián tiếp Phỏng vấn có cấu trúc Phỏng vấn không có cấu trúc
Phương pháp trả lời Trả lời đóng (chọn câu thích hợp, optional) Trả lời mở (tự đưa ra câu trả lời, open questions)
Ưu khuyết điểm của phương pháp trả lời đóng Thuận tiện trả lời Dễ phân tích kết quả Khuyết Không thể liệt kê hết các trường hợp Chủ quan Chưa phản ánh đúng ý tưởng/nguyện vọng của người được phỏng vấn)
Ưu khuyết điểm phương pháp trả lời mở Khám phá thêm điều mới Không chủ quan Khuyết Khó phân tích kết quả Gây phiền hà (tốn thời gian) Chỉ dành cho người biết chữ.
Ưu khuyết điểm phương pháp phỏng vấn trực tiếp Có cơ hội giải thích Bổ túc thêm thông tin (nhìn thấy trực tiếp) Thông tin có chiều sâu. Ứng dụng rộng rãi (biết/không biết chữ) Khuyết Tốn thời gian Đắt tiền Phụ thuộc người phỏng vấn Có thể có thiên lệch
Phương pháp phỏng vấn gián tiếp Phương tiện thu thập: Bưu điện – email – Điện thoại – internet. Phải tạo thuận lợi cho việc phản hồi. Các yêu cầu về bảng câu hỏi: Hình thức dễ gây cảm tình. Không quá nhiều câu hỏi. (<30) Sắp xếp câu hỏi có tính hệ thống (logic). Câu hỏi phải rõ ràng, dễ hiểu.
Ưu khuyết điểm phương pháp phỏng vấn gián tiếp Ưu: - Ít tốn kém, bảo đảm bí mật. Khuyết: - Giới hạn cho người biết đọc, biết viết. - Tỉ lệ trả lời thường rất thấp => số lượng tăng. - Thiếu cơ hội làm sáng tỏ vấn đề. - Thiếu thông tin hỗ trợ (quan sát…) - Có thể tham vấn từ người khác.
Ghi chú: Khó có thể thiết kế mẫu điều tra hoàn hảo trong 1 lần duy nhất => điều tra thử (n lần) => hiệu chỉnh/bổ sung chi tiết v.v
Dung lượng mẫu Công thức 1: n = (N * n’)/(N + n’) trong đó n: số lượng mẫu N: dân số n’= [P’*(1-P’)]/(SEp)2 P’: tỉ lệ dân số có cùng đặc tính. SEp: mức độ sai số chấp nhận được. (xem ví dụ 1)
Dung lượng mẫu (tt) Công thức 2: - Đại diện cho tổng thể - số mẫu n ≥ (t2 * S2) / (L2) trong đó t: giá trị t tương ứng với mức ý nghĩa 0,05 hoặc 0,01 t2 = 4 khi mức ý nghĩa 0,05 t2 = 7 khi mức ý nghĩa 0,01. S: phương sai của dân số (hoặc mẫu > 30). L: sai số cho trước. (xem ví dụ 2)
Ví dụ: Một mẫu dân số có 2000 người Ví dụ: Một mẫu dân số có 2000 người. Trong đó, 62% có cùng đặc tính A, mức sai số chấp nhận được là 2%. Tính số lượng mẫu. Giải: Tính n’= [0,62(1- 0,62)]/ (0,02)2 = 589. Vậy n = (2000*589)/(2000+589) = 455
Ví dụ 2: Một qui trình sản xuất sơn có năng suất 20 tấn/ngày. Độ lệch chuẩn 3 tấn/ngày. Nay thay đổi qui trình sản xuất, cần theo dõi bao nhiêu ngày để sai số khoảng 1,5 tấn/ngày. Mức 0,05 => n = (4*32)/(1,5)2 = 36/2,25 = 16 ngày. Mức 0,01 => n = 28 ngày (tự tính toán).
5b. Kỹ thuật lấy mẫu - Chọn mẫu: + Ngẫu nhiên. + Phân tầng/lớp. + Theo hệ thống + Theo nhiều giai đoạn - Thủ thuật: tuân thủ quy định của từng ngành nghề (xem các tài liệu chuyên ngành).
d. Tổ chức thực hiện Lập kế hoạch thực hiện. - Tập huấn (trong trường hợp cần thiết) - Thư (hoặc trực tiếp) hẹn làm việc. - Thời điểm thực hiện - Thời gian thực hiện - Kế hoạch di chuyển - Nơi ăn ở. 2. Lập dự trù kinh phí. 3. Tiến hành thực hiện
Chương 3: Xử lý, phân tích và đánh giá kết quả Nội dung Sắp xếp – Tổ chức dữ liệu Các phương pháp phân tích dữ liệu Đánh giá kết quả – khuyến cáo.
1. Sắp xếp – Tổ chức dữ liệu Hiệu chỉnh những sai sót, không rõ ràng. Loại bỏ/hiệu chỉnh số liệu đột biến. Tính toán lại theo yêu cầu của mục tiêu. Tuân thủ theo định dạng của phần mềm thống kê. Mã hóa. Chuyển đổi số liệu (nếu cần thiết) Lưu trử dữ liệu phải có tính hệ thống.
Xử lý số liệu (data cleaning) Hiệu chỉnh dữ liệu Xem xét từng câu hỏi. Xem xét tất cả các câu hỏi. Mã hoá dữ liệu Xây dựng bảng mã hoá (sách mã hoá) Kiểm chứng dữ liệu sau khi mã hoá.
2. Các phương pháp phân tích dữ liệu a. Kiểu phân tích. + Định lượng: Bảng biểu (đơn, 2 chiều, 3 chiều). Đồ thị (dạng đường, dạng bánh, dạng thanh, v.v…) + Theo thống kê: So sánh trung bình (T- test, F- test) Bác bỏ giả thuyết (chi-square) Tương quan/hồi quy (correlation/regression) b. Phương tiện Lý thuyết (thủ công)(xem các tài liệu đính kèm) Máy tính (phần mềm thống kê hỗ trơ: ví dụ: SAS, Statgraphic, Excel, Minitab, MSTATC ……)
Bảng 1 chiều Độ tuổi Số người trả lời – (%) < 20 4 – ( 2) 20 – 29 4 – ( 2) 20 – 29 36 – (18) 30 – 39 50 – (25) 40 – 49 70 – (35) 50 – 59 20 – (10) > 60 Tổng cọng 200 – (100)
Bảng 2 chiều/3 chiều (xem tài liệu)
Dạng đồ thị (dạng thanh chồng lên nhau)
Đồ thị (dạng thanh kề nhau)
Đồ thị (dạng tổng hợp)
Đồ thị (dạng bánh)
Đồ thị (dạng đường và tương quan)
Đánh giá kết quả - Khuyến cáo a. Đánh giá: - Theo thống kê - Theo kinh tế (lợi nhuận / hiệu quả đầu tư) - Theo tiện ích / môi trường / xã hội, …) b. Kết luận- Khuyến cáo: - Đưa ra những nhận xét / kết luận của mình. - Khuyến cáo cho: Nông dân/Cán bộ kỹ thuật/ lãnh đạo/ nhà nghiên cứu/ … những giải pháp, biện pháp cần thực hiện để mang lại hiệu quả cao nhất.