43
Chương trình môn học Phương pháp thí nghiệm 1 (điều tra, survey) Tổng số tiết: - Theo đơn vị học trình (15 tiết LT) - Theo tín chỉ (1 tín chỉ = 15 tiết LT) Nội dung : Chương 1: Giới thiệu môn học ( 3 LT) Chương 2: Phương pháp điều tra (6 LT ) Chương 3: Xử lý- Phân tích–Đánh giá kết quả (6 LT ) Tài liệu tham khảo : 1. Phương pháp bố trí thí nghiệm và xử lý số liệu thực nghiệm”, Phan hiếu Hiền, 1996. 2. Phương pháp luận nghiên cứu khoa học, Khải Minh, Thanh Mai, Hoàng Phúc, Nhà xuất bản Lao động Xã hội, 2007. 3. Phương pháp ứng dụng và phương pháp thí nghiệm”, Bùi việt Hải, 2007 4. Research design and methods, a process approach, 7 th edition, Kenneth S. Bordens and Bruce B. Abbott, 2008.

Chương trình môn học Phương pháp thí nghiệm 1 (điều … · Web view(bảng câu hỏi): Bảng câu hỏi là danh sách các câu hỏi dưới dạng viết để

Embed Size (px)

Citation preview

Chương trình môn học Phương pháp thí nghiệm 1 (điều tra, survey)

Tổng số tiết: - Theo đơn vị học trình (15 tiết LT)- Theo tín chỉ (1 tín chỉ = 15 tiết LT)

Nội dung:Chương 1: Giới thiệu môn học ( 3 LT)Chương 2: Phương pháp điều tra (6 LT )Chương 3: Xử lý- Phân tích–Đánh giá kết quả (6 LT )

Tài liệu tham khảo:1. Phương pháp bố trí thí nghiệm và xử lý số liệu thực nghiệm”, Phan hiếu

Hiền, 1996.2. Phương pháp luận nghiên cứu khoa học, Khải Minh, Thanh Mai, Hoàng

Phúc, Nhà xuất bản Lao động Xã hội, 2007.3. Phương pháp ứng dụng và phương pháp thí nghiệm”, Bùi việt Hải, 20074. Research design and methods, a process approach, 7th edition, Kenneth S.

Bordens and Bruce B. Abbott, 2008.

Chương trình chi tiết môn học PPTN 1 (điều tra-survey)

Chương 1: Giới thiệu môn học (3 LT)I. Mục tiêu môn học.II. Các yêu cầu về điều tra/thu thập dữ liệuIII. Tính chất/đặc tính điều traIV. Các môn học và kỹ năng cần thiếtV. Các phương pháp thống kê trong nghiên cứu.VI. Các khái niệm cơ bản trong thống kêVII. Trình tự thực hiện điều tra nghiên cứu

Chương 2: Phương pháp điều tra (6 LT)I. Giới thiệu chung.II. Trình tự thực hiện điều tra nghiên cứu

II.1. Chọn đề tài, xác định mục tiêu/vấn đề/đối tượng cần nghiên cứu.II.2. Các phương pháp điều traII.3. Thiết kế mẫu điều tra.II.4. Số lượng mẫu điều tra.

III. Các yếu tố và kỹ năng cơ bản.IV. Tổ chức thực hiệnGhi chú: Sinh viên thực hành bằng cách tự thiết kế mẫu điều tra (theo nhóm) với chủ đề được chọn lọc do nhóm đưa ra ( có tính điểm ). Sau khi chỉnh sửa, sinh viên nộp mẫu điều tra cho giảng viên và tự đi điều tra thu thập số liệu (thực hành trực tiếp ngoài đồng ruộng) dựa trên mẫu điều tra đã thiết kế (nếu không đi điều tra sẽ không có số liệu và bị điểm 0).

Chương 3: Xử lý-Phân tích-Đánh giá kết quả (6 LT)I. Tiến trình xử lý dữ liệu II. Hiệu chỉnh dữ liệu III. Mã hoá dữ liệu.IV. Phân tích và trình bày dữ liệu

IV.1. Định lượng (bảng biểu, đồ thị)IV.2. Thống kê (tương quan/hồi quy, so sánh trung bình/T-test, trắc nghiệm giả thiết/Chi square)

V. Vai trò tin học trong xử lý/phân tích/trình bày dữ liệu

Ghi chú: Sinh viên sẽ sắp xếp, tổ chức và phân tích các dữ liệu đã thu thập ở phần trên. Nếu sinh viên không thực hiện điều tra sẽ không có kết quả => phần này sinh viên sẽ bị điểm 0.

Chương 1: Giới thiệu môn học (3 LT)

Nội dung:I. Mục tiêu môn học.II. Các phương pháp thống kê trong nghiên cứu.III. Các khái niệm cơ bản trong thống kêIV. Trình tự thực hiện điều tra nghiên cứu

Các từ khoá: Nghiên cứu, điều tra, quan sát, thiết kế thí nghiệm, dữ liệu (số liệu), dân số, mẫu.

Các vấn đề cần nắm vững: - Thế nào là 1 nghiên cứu khoa học- Điều tra là gì? Các yêu cầu về tiến hành 1 cuộc điều tra.- Trình tự thực hiện điều tra nghiên cứu.- Các khái niệm và cách tính toán các thông số trong thống kê.

I.Mục tiêu môn học:

Điều tra khảo sát (survey) hay quan sát (observation) là sự ghi nhận những hiện tượng xảy ra trong thiên nhiên một cách đúng đắn, chính xác trung thực. Điều tra nhằm mục đích thu thập số liệu (mẫu điều tra thay vì tổng thể) và phân tích số liệu đã được thực hiện hoặc sẽ thực hiện (bởi những thành phần không phải là chủ thể điều tra) (đây là sự khác biệt giữa điều tra và thiết kế thí nghiệm hoặc quan sát) để trả lời những vấn đề đặt ra trong nghiên cứu (tổng thể).Ghi chú: - Trong môn học này không đề cập đến các lãnh vực nghiên cứu về xã hội, chính trị, v.v.. mà chỉ chú trọng đến các điều ra nghiên cứu lãnh vực thuộc về khoa học tự nhiên.

II. Các yêu cầu trong điều tra.1. Đầy đủ thông tin thật sự cần thiết2. Trung thực/ chính xác3. Ngẫu nhiên/khach quan.

III. Các tính chất/đặc tính của điều tra.1. Dữ liệu thường là đã có sẳn 2. Dữ liệu thuộc sở hữu của người khác3. Diện rộng (vùng ảnh hưởng rộng lớn, cấp xã, huyện v.v…) 4. Đa biến.

IV. Các môn học và kỹ năng cần thiết1. Các môn học : Toán, Xác suất thống kê, Tin học, Kỹ năng giao tiếp2. Các kỹ năng : Quan sát, Phân tích – tổng hợp.

V. Các phương pháp thống kê trong nghiên cứu:

Môn học này cũng không đề cập đến phương pháp quan sát và thiết kế thí nghiệm. Tuy nhiên để hiểu rõ hơn, chúng tôi cũng xin trình bày các phương pháp có thể áp dụng trong nghiên cứu

Hình 1: Những phương pháp thống kê trong nghiên cứunguồn: Experimental design, lecture notes, Emeterio S. Solivas, Statistic 162.

Như vậy, Điều tra là một công cụ của nghiên cứu khoa học (nghiên cứu khoa học là tìm ra và giải thích các hiện tượng mới, nghĩa là xác lập các liên hệ giữa các hiện tương và phát biểu thành các quy luật chung. Chúng có thể đi từ cái chung đến cái riêng – suy luận diễn dịch- hoặc chúng có thể đi từ cái riêng sang cái chung – suy luận quy nạp)

VI. Các khái niệm cơ bản trong thống kê:(nguồn: Phương pháp bố trí thí nghiệm và Xử lý số liệu, T.S Phan hiếu Hiền)

III.1. Dân số và mẫu:III.1.1. Dân số (population): còn gọi là quàn thể, là tập hợp tất cả

các trị số của một đặc tính của một sự vật. Ví dụ:

Sự vật Đặc tính Trị sốSinh viên Nông Lâm Chiều cao (m) 1,5; 1,52; 1,55; 1,6; 1,7

Tuổi 18; 19; 20; 21; ….. 30;Trọng lượng (kg) 35; 40; 45; …….60; 70

Thu thập dữ liệu

Xác định mục tiêu/vấn đề/đối tượng cần nghiên cứu

Thiết kế thí nghiệm

Tiếp cận những nghiên cứu trước đây

Điều tra, Quan sát

Số liệu Đo đạc, Ghi chépThông tin ban đầu

Xem xét số liệu ban đầu

Xem xét dữ liệu

Phát hiện sai sót, sắp xếp tinh gọn, làm sạch

Lựa chọn kiểu phân tích

Phân tích dữ liệu

Ước tính, dự đóan

Trắc nghiệm giả thiết

Đưa ra quyết định, kết luận

Khuyến cáo cho những nghiên cứu tiếp theo

Nông dân Diện tích sở hữu (ha) 0,4; 0,8; 1; 2; 5……20Phương pháp canh tác Độc canh lúa, đa canh…

Cây trồng Giống A; B; C; ……….; E; HTuổi cây 1; 3; 5; …………..15

Ghi chú:- Dân số theo nghĩa thống kê khác với dân số theo nghĩa thông thường.- Một sự vật có thể có nhiều dân số.- Dân số có thể là vô tận hoặc có giới hạn.

III.1.2 Mẫu (sample): Vì dân số có thể mang 1 giá trị rất lớn, ít ai có thể có công sức, thời gian và nguồn lực để đo đếm cho hết. Vì vậy, chúng ta chỉ chọn ra 1 phần của dân số (theo 1 cách thức nào đó) để đo đếm (gọi là mẫu).Có 2 loại mẫu: Mẫu chủ quan và mẫu ngẫu nhiên.

- Mẫu chủ quan: là mẫu được chọn theo 1 ý đồ định trước của người nghiên cứu. Ví dụ: Chọn ra 12 người nam sinh viên Nông lâm có chiều cao hơn 1,8m để thành lập đội bong chuyền. Mẫu này không có giá trị, côn dụng trong thống kê.

- Mẫu ngẫu nhiên: là mẫu được chọn sao cho các mẫu cùng điều kiện có cơ hội được chọn như nhau (một cách ngẫu nhiên). Từ đó, thí nghiệm ngẫu nhiên có thể xảy ra như sau:

+ Có thể cho ra nhiều kết quả khác nhau mặc dù được thực hiện trong cùng 1 điều kiện và đã biết trước (ví dụ: thảy đồng xu => sấp hoặc ngữa)

+ Có thể lập lại và cũng không thể lập lạiVí dụ: a. Thảy đồng xu => có thể lập lại (nếu như đồng xu không bị mòn)b. Hỏi anh A có muốn cưới chị B không? => không thể lập lại (vì nếu hỏi lần thứ hai sẽ bị ám thị từ lần hỏi thứ nhất).

III.1.3. Mối liên hệ giữa dân số và mẫu:- Từ dân số có thể xác định cách phân bố mẫu (lý thuyết xác suất)- Từ mẫu có thể suy đoán kết luận về dân số (lý thuyết thống kê). Vì vậy mẫu

phải là mẫu ngẫu nhiên.

III.1.4. Các thông số của mẫu: các thông số phổ biến là:1. Số trung bình (Mean, average, Xtb): số trung bình Xtb được tính như sau:

Xtb = (f1X1 + f2X2 + …..fnXn) / (f1+f2+…+fn)Nếu f1=f2=…=fn => Xtb = Σn

i=1Xi / n = (X1 + X2 + …+Xn)/nVí dụ : Kết quả điều tra diện tích đất nông nghiệp mà người nông dân sở hữu được như sau:

Diện tích (ha) Số lượng Tổng0,5 4 20,6 5 30,8 5 41,0 4 4

1,5 10 152,0 5 103,0 2 64,0 1 45,0 2 1010,0 2 20Tổng 40 78

Diện tích trung bình mà người nông dân sở hữu ở khu vực điều tra là:Xtb = (4*0,5 + 5*0,6 + 5*0,8 +….+ 2*10) / (1+2+…..+2) = 78/40 = 1,95 ha.

2. Phương sai (Variance, S2): biểu thị mức độ biến động tuyệt đối của một biến số định lượng. Phương sai được tính như sau:

S2 = SS/df . trong đó SS (tổng bình phương, sum of square), df: độ tự doSS = Σ( xi – xtb)2 = Σxi2 – ( Σxi)2/n và df = n-1Từ đó: S2 = 1/(n-1) * [Σxi2 – ( Σxi)2/n] hoặc

S2 = 1/(n-1) * [Σ(fixi)2 – ( Σfixi)2/n]Ghi chú: nếu n quá lớn => có thể xem (n – 1) = n.

Với ví dụ trên đây, S2 = 1/(n-1)*[922 – 152,1] = 769,9/(40-1) = 19,76

3. Độ lệch chuẩn (standard deviation, Sd): Sd = (S2)1/2 . Nếu Sd lớn có nghĩa là biến động của biến X càng cao, nói cách khác là các giá trị đo đạc càng phân tán xa giá trị trung bình (và ngược lại).Trong ví dụ trên => Sd = 4,44

4. Hệ số biến động (Coefficient of variation, Cv): mức độ biến động bình quân tương đối của chỉ tiêu nghiên cứu. Cv được tính bằng đơn vị %.

Cv(%) = 100 * (Sd/xtb) = 100*(4,44/1,95) # 230%.

5. Biên độ biến động (range, R): hay còn gọi là phạm vi biến động, là khoảng chênh lệch giữa trị số quan sát lớn nhất và trị số quan sát nhỏ nhất của biến nghiên cứu. R = x max – x min Trong ví dụ trên => R = 10 – 0,5 = 9,5 ha.Nguồn: Thống kê ứng dụng và phương pháp thí nghiệm, T.S Bùi việt Hải….Ghi chú: Các thông số chưa có ví dụ tính toán, sinh viên tự áp dụng công thức để tính toán.- Các thông số trên đây có thể được tính toán dựa vào phần mềm EXCEL theo các bước như sau (sẽ được hướng dẫn trên lớp học).Tools => Data analysis => descriptive statistics => Input data => output data => summary.

VII. Trình tự thực hiện điều tra nghiên cứu:

Để thực hiện cả quá trình điều tra nghiên cứu, chúng ta thường tiến hành theo những bước như sau:

1. Thiết lập bài toán nghiên cứu (hình thành đề tài nghiên cứu).2. Quan niệm hoá thiết kế nghiên cứu (hình thành giả thiết, mối quan hệ).3. Thiết kế mẫu điều tra (mẫu điều tra và số lượng mẫu).4. Xây dựng phương tiện và phương pháp thu thập dữ liệu5. Thu thập dữ liệu6. Xử lý và phân tích dữ liệu7. Đánh giá - Viết/trình bày báo cáo

Ghi chú: Nội dung chi tiết các bước trên đây sẽ được trình bày trong các chương tiếp theo.

Chương 2: Phương pháp điều tra (6 LT)

Nội dung:I. Giới thiệu chungII. Phương pháp điều tra nghiên cứu

II.1. Chọn đề tài, xác định mục tiêu/vấn đề/đối tượng cần nghiên cứu.II.2. Thiết kế mẫu điều tra.II.3. Số lượng mẫu điều tra.II.4. Kỹ thuật lấy mẫu điều tra

III. Các yếu tố và kỹ năng cơ bản.IV. Tổ chức thực hiện

Từ khoá: Thu thập dữ liệu, mẫu điều tra, độ tin cậy, phỏng vấn, kỹ thuật lấy mẫu. Các vấn đề cần lưu ý:

- Trình tự thực hiện điều tra nghiên cứu.- Lựa chọn kỹ thuật lấy mẫu điều tra.- Cách thiết kế mẫu điều tra.- Cách xác định số lượng mẫu điều tra.- Tổ chức và thực hiện công tác điều tra.

I. Giới thiệu chung:

Như đã trình bày trong chương một, điều tra nghiên cứu là 1 phương pháp thống kê trong nghiên cứu, nhằm mục đích thu thập số liệu (từ những thành phần không phải là chủ thể điều tra), sau đó xử lý và phân tích số liệu để phục vụ cho mục đích nghiên cứu.

Như vậy, điều ra nghiên cứu đòi hỏi phải được tổ chức nghiêm túc cẩn thận và tỉ mỉ để việc thu thập số liệu được chính xác, đầy đủ (đây là yêu cầu hàng đầu rất quan trọng trong điều tra nghiên cứu).

II. Phương pháp điều tra nghiên cứuQuá trình điều tra nghiên cứu thường được thực hiện thông qua các bước

được tóm tắt trong sơ đồ như sau:

Cái gì Như thế nào Triển khai nghiên cứu

Ghi chú: + Ô vuông, chử nhật: lý thuyết cần nắm vững+ Ô tròn, oval: các bước trung gian

Lưu ý và các bước

Chức năng

Phương pháp và công cụ

Lý thuyết và thiết kế

Phương pháp, máy tính, thống kê Nguyên lý

1 2 3 4 5 6 7

Biến và giả thiết Định nghĩa và phân loại

Thiết kếTính xác thực và tin cậy

Nội dung

Kiểm tra tại hiện trường

Hiệu chỉnh dữ liệu

Mã hoá

Xem xét tài liệu

Phát triển sách mã

Trong chương này, chúng ta chỉ tìm hiểu sâu về các bước được rút gọn như sau: (1) Xác định đối tượng nghiên cứu (gồm các bước 1, 2 trong 7 bước trên đây) (2) Thiết kế mẫu điều tra (gồm: bước 3, 4, 5 trong 7 bước trên đây)(3) Kỹ thuật lấy mẫu (bước 6 thu thập dữ liệu)(4) Số lượng mẫu điều tra (bước 6: thu thập dữ liệu)

II.1. Chọn đề tài, xác định mục tiêu/vấn đề/đối tượng cần nghiên cứu.Mục tiêu nghiên cứu có thể bắt nguồn từ 3 nguồn sau:(1) từ thực tế (2) từ các nghiên cứu trước đó (3) từ ý tưởng mới.Ngoài ra, mục tiêu nghiên cứu cần phải được xác định một cách rõ ràng, cụ thể.

Vì rằng mọi công việc tiếp theo sau đó đều bị ảnh hưởng bởi cách thiết lập bài toán nghiên cứu. Các bước sau đây giúp chúng ta nhận diện được vấn đề 1 cách đầy đủ lập luận (logic) trong vịệc xác lập đề tài nghiên cứu.

- Xác định lãnh vực rộng (bao quát) của chuyên ngành.- Phân chia lãnh vực rộng này thành những lãnh vực cụ thể nhỏ hơn.- Xác định mục tiêu chính, phụ cho bài toán nghiên cứu.- Xác định tính khả thi để đạt mục tiêu (nguồn lực, kiến thức ….)Những yếu tố cần phải xem xét để ước lượng bài toán nghiên cứu là: nguồn tài

chính, qũy thời gian, kiến thức, năng lực/kỹ năng chuyên môn, nguồn nhân vật lực, các phương tiện hỗ trợ v.v..

Ngoài ra, để công việc điều tra nghiên cứu không bị trùng lắp (lãng phí), hoặc được làm sáng tỏ hơn, đầy đủ hơn. Chúng ta cần phải xem xét tất cả các tài liệu đang có (mặc dù điều này rất tốn thời gian, chán nản và bực mình) để hỗ trợ hữu ích trong việc triển khai nghiên cứu. Việc xem xét tài liệu có 3 chức năng sau:

1. Làm sáng tỏ và tập trung vào đề tài nghiên cứu.2. Cải tiến phương pháp luận3. Mở rộng nền tảng kiến thức vê lãnh vực đang xem xét nghiên cứu.

Có 2 nguồn chính (dạng chữ số thông thường và dạng điện tử) là: Sách và tạp chí. Việc xem xét tài liệu là quá trình gồm 4 bước: (1) Tìm kiếm tài liệu (2) xem xét tài liệu (3) phát triển khung lý thuyết (4) phát triển khung cơ sở quan niệm.

Các quá trình trên đây đòi hỏi những kỹ năng khác nhau, trong đó hai quá trình (3) và (4) là khó khăn hơn cả.

Sau khi tìm kiếm được những sách và tạp chí có ích, việc cần làm tiếp theo là đọc thật kỹ lưỡng để xác định các tương quan, tương ứng giũa thong tin trng tài liệu với đề tài. Việc đọc tài liệu cần chú ý những vấn đề sau đây:

- Chú thích xem những kiến thức có phù hợp với khung cơ sở lý thuyết đã được khẳng định hay chưa.

- Chú thích về các lý thuyết đã được đưa ra cùng với các phê bình tương ứng (thiết kế nghên cứu, kích cở mẫu, đặc tíh mẫu, thủ tục đo lường v.v...)

- Khảo sát xem mức độ nào, các kết quả nào có thể tổng quát hóa cho các tình huống khác.

- Chú thích về những khác biệt và cho ý kiến riêng về tính xác thực của khác biệt đó.

- Nhận diện các lãnh vực có rất ít thong tin hay không có thông tin.Tóm lại, xem xét tài liệu là 1 quá trình lien tục. Nó bắt đầu trước khi đặt ra đề tài nghiên cứu cho đến khi hoàn thành báo cáo. Việc xem xét tài liệu làm cho việc nghiên cứu có tính rõ rang, hướng về trọng điểm, cải thiện phương pháp nghiên cứu và mở rộng kiến thức của chúng ta.

II.2. Thiết kế mẫu điều tra: Mục đích của việc thiết kế mẫu điều tra là để thu thập dữ liệu được đầy đủ,

chính xác, thuận lợi và phù hợp với các điều kiện mà nhóm thực hiện điều tra có sẵn. Vì vậy, trước khi thiết kế mẫu điều tra, chúng ta cần tiếp cận các nguồn thông tin để nắm rõ và làm sáng tỏ các nội dung cần tiến hành điều tra phục vụ cho mục tiêu nghiên cứu. Có 2 nguồn tiếp cận chính để tập hợp thông tin về 1 tình huống ((a)thông tin có sẵn và (b) thông tin phải được tập hợp thu thập thêm vào, thông tin mới). Dữ liệu cũng được chia thành 2 loại là: (1) dữ liệu sơ cấp (nguồn chính, ban đầu) và (2) dữ lịệu thứ cấp (nguồn phụ, nguồn thêm vào). Để thiết kế mẫu điều tra, các vấn đề (hay còn gọi là các công việc, các bước) sau đây cần phải được xem xét chọn lọc kỹ lưỡng.Tóm tắt các bước , các công việc trên đây bởi sơ đồ về các phương pháp thu thập dữ liệu như sau:

Các phương pháp thu thập dữ liệu

Dữ liệu sơ cấp Dữ liệu thứ cấp

Tư liệuCác ấn bản của chính phủCác nghiên cứu trước đây.Các mẫu tin cá nhân

Quan sát Phỏng vấn (trực tiếp)

Bảng câu hỏi (gián tiếp)

Người tham dự Có cấu trúc Gửi qua bưu điện

Người không tham dự

Không có cấu trúc

Bảng câu hỏi dạng tập hợp

Hình 2.2: Các phương pháp thu thập dữ liệu.

Tuy nhiên trong bài này, chúng tôi chỉ đề cập 1 cách chi tiết hai (2) phương pháp thu thập dữ liệu là : (a) Phỏng vấn hay thu thập dữ liệu trực tiếp và (b) thu thập dữ liệu gián tiếp thông qua bảng câu hỏi.

II.2.1. Phỏng vấn: Người ta phân chia phỏng vấn thành 2 loại tùy theo mức độ linh hoạt của chúng như sau:

- Phỏng vấn không có cấu trúc- Phỏng vấn có cấu trúc

II.2.1.1: Phỏng vấn không có cấu trúc: hay còn gọi là phỏng vấn chiều sâu, người phỏng vấn triển khai 1 khung cơ sở (gọi là hướng dẫn phỏng vấn). Sau đó, người phỏng vấn tự ý thiết lập ra các câu hỏi trong suốt cuộc phỏng vấn. Phương pháp này vô cùng hữu ích ở những trường hợp thong tin cần ít hiểu biết và tìm kiếm những thong tin theo chiều sâu. Người phỏng vấn có thể linh hoạt đặt câu hỏi với người trả lời tùy theo tình hình tại thời điểm phỏng vấn, tùy theo khả năng phát hiện những thiếu sót trong quá trình chuẩn bị nội dung phỏng vấn hoặc khả năng phát hiện những điều mới lạ nảy sinh thêm. Do đó, phương pháp này gíup ích rất nhiều trong khả năng phát triển chiều sâu nội dung nghiên cứu hoặc để chỉnh sửa những sai sót, thiếu sót trong quá trình chuẩn bị phỏng vấn theo cấu trúc (sẽ trình bày trong phần tiếp theo)

Tuy nhiên, vì không có cấu trúc nên việc so sánh các câu hỏi và câu trả lời rất khó khăn. Ngoài ra, phương pháp này cũng đòi hỏi người phỏng vấn có 1 kỹ năng và kiến thức cao hơn phỏng vấn theo cấu trúc.

II.2.1.2. Phỏng vấn có cấu trúc: là cuộc phỏng vấn với những câu hỏi đã được xác định trước. Phương pháp này không linh hoạt nhưng có ưu điểm là cung cấp thong tin đồng nhất, dễ so sánh kết quả từ dữ liệu thu thập và ít đòi hỏi kỹ năng người phỏng vấn.

Như vậy, thông thường để bổ khuyết cho nhau. Người ta lập ra cấu trúc câu hỏi (phỏng vấn có cấu trúc), sau đó kiểm tra lại bằng cách sử dụng những người phỏng vấn có kinh nghiệm tham gia kiểm tra lại (bằng phỏng vấn không cấu trúc) để khám phá những thiếu sót trong quá trình hình thành cấu trúc câu hỏi ban đầu đặt ra. Từ đó hoàn chỉnh cấu trúc câu hỏi để tiến hành thực hiện thu thập dữ liệu.

II.2.2. Phỏng vấn gián tiếp (bảng câu hỏi): Bảng câu hỏi là danh sách các câu hỏi dưới dạng viết để tiếp nhận câu trả lời từ người được phỏng vấn (người trả lời). Như vậy bảng câu hỏi phải tuân thủ 1 số điều kiện sau đây:

- Hình thức bảng câu hỏi phải dễ bắt mắt để gây cảm tình với người trả lời. ( trường hợp phỏng vấn gián tiếp).

- Nên có lá thư ngỏ ngắn gọn để giới thiệu, giải thích, mô tả mục đích, khẳng định tính bí mật, cung cấp địa chỉ để lien lạc khi cần thiết, và cám ơn (trường hợp phỏng vấn gián tiếp)

- Không nên quá nhiều (gây mệt mỏi cho người được phỏng vấn), nhưng phải đầy đủ nội dung theo yêu cầu đặt ra của đề bài.

- Việc sắp xếp các câu hỏi phải theo 1 trật tự (logic) nào đó để thuận tiện trong việc trả lời câu hỏi (thông thường những sự kiện được đặt ra để phỏng vấn là sự kiện đã xảy ra trước đó, vì vậy nếu không có hệ thống lập luận thì người trả lời dễ bị nhầm lẫn, điều này gây tác hại rất lớn là thông tin thu thập không chính xác.Ví dụ: Thông tin chung (diện tích, tình trạng gia đình…), thông tin kỹ thuật (giống, phân bón, chăm sóc….), thông tin kinh tế (năng suất, giá bán, địa điểm/cơ quan thu mua…), các thông tin khác (tín dụng, khuyến nông….)

- Câu hỏi phải rõ ràng, dễ hiểu, ngôn từ đơn giản thông dụng hang ngày và không được mang tính dẫn dắt (tránh gây ra hiểu nhầm, hiểu nhiều chiều, hiểu nhiều ý, hoặc khó hiểu hoặc thiên lệch).Ví dụ 1: Bạn có hài lòng về nhà ăn tập thể của bạn không? (không nói rõ là hài lòng hoặc không hài lòng về dịch vụ nào?(dịch vụ, giá cả, tiện nghi, chất lượng)).Vídụ 2: Hút thuốc có hại phải không? (đã gợi ý sẳn)Ví dụ 3: Có thể thảo luận nhóm 100 sinh viên không? (không nói rõ quy định là bắt buộc 100 sinh viên cho 1 nhóm hay không? Hay có thể chia nhóm nhỏ? Cũng không nói rõ về các tiêu chí như là đề tài thế nào? Hấp dẫn hay không?)- Câu hỏi đặt ra có thể có 2 cách trả lời (a) chọn lựa câu trả lời đã được gợi ý sẵn hay còn gọi là phương pháp trả lời đóng (b) câu trả lời được để trống cho người trả lời tự do trả lời theo ý của mình hay còn gọi là phương pháp trả lời mở. Mỗi phương pháp chọn lựa kiểu câu hỏi để trả lời đều có những ưu khuyết điểm riêng như sau:

Ưu khuyết điểm của phương pháp trả lời đóng:+ Ưu điểm: - Rất thuận tiện cho người trả lời.

- Rất dễ dàng trong phân tích kết quả+ Khuyết điểm: - Không thể liệt kê hết toàn bộ những trường hợp có thể xảy

ra (thiếu chiều sâu, không đa dạng)- Dễ dàng chịu ảnh hưởng chủ quan của người phỏng vấn (chủ quan khi thiết

lập câu hỏi và những sự lựa chọn đặt ra).- Câu trả lời có thể không phản ảnh đúng suy nghĩ của người trả lời (khuôn

mẫu lựa chọn đã được định sẵn)Ưu khuyết điểm của phương pháp trả lời mở:

+ Ưu điểm: - Người trả lời không bị bó hẹp giới hạn trong những lựa chọn do người phỏng vấn đưa ra => có thể khám phá thêm nhiều tình huống mới.

- Không chịu ảnh hưởng chủ quan của người phỏng vấn =>khách quan, không thiên lệch.

+ Khuyết điểm: - Khó phân tích kết quả- Dễ gây phiền hà cho người trả lời (viết, tốn nhiều thời gian suy nghĩ).- Chỉ giới hạn đối với thành phần biết chữ.

Các phương tiện/phương pháp để thu thập dữ liệu gián tiếp có thể là: bưu điện, email, internet, điện thoại.

Ngoài ra, phương pháp phỏng vấn trực tiếp và phương pháp gián tiếp (bảng câu hỏi) cũng đều có những ưu khuyết điểm như sau:

II.2.3. Phương pháp phỏng vấn trực tiếp:- Ưu điểm:

* Thích hợp đối với những tình huống phức tạp (người phỏng vấn có thể nhận diện trực tiếp vấn đề và có cơ hội giải thích cho người trả lời rõ vấn đề)

* Phù hợp cho những trường hợp cần thu thập thông tin có chiều sâu (trong quá trình phỏng vấn, có thể khám phá thêm những vấn đề mới, chi tiết hơn)

* Có thể bổ túc thêm những thông tin cần thiết trong quá trình phỏng vấn.* Ứng dụng rộng rãi (người biết chử/không biết chử; người già/trẻ em v.v..)

- Khuyết điểm: * Tốn nhiều thời gian và đắt tiền.* Chất lượng dữ liệu phụ thuộc rất nhiều vào cuộc phỏng vấn trao đổi (phụ

thuộc vào môi trường (địa điểm/thời gian/ngoại cảnh) phỏng vấn, tâm trạng người được phỏng vấn v.v..).

* Chất lượng dữ liệu cũng phụ thuộc vào năng lực của người phỏng vấn (kinh nghiệm, khả năng giao tiếp, v.v…)

* Có thể có sự thiên lệch của người nghiên cứu và người phỏng vấn (cách thức đưa ra câu hỏi, có gợi ý trước, giải thích câu hỏi v.v…)

II.3. Số lượng mẫu điều tra: Điều hiển nhiên là khó có thể thu thập hết toàn bộ dân số (qúa lớn) và số lượng mẫu càng nhiều càng tốt, càng chính xác. Tuy nhiên, vấn đề này còn liên quan đến vấn đề tài chính, nhân vật lực v.v… Vì vậy câu hỏi đặt ra là: Số lượng mẫu điều tra bao nhiêu là thoả mãn yêu cầu đặt ra? Để giải quyết bài toán trên đây, thông thường người ta dựa vào các yếu tố sau:

- Mức độ tin cậy (bao nhiêu phần trăm (95% hay 99%)- Mức độ chính xác là bao nhiêu? (so với số trung bình)- Độ lệch chuẩn là bao nhiêu? (phạm vi phân bố mẫu)- Khả năng tài chính, nhân vật lực có được? (khả năng thực hiện).

Công thức thường được sử dụng khi số lượng mẫu n > 10% dân số là:

Công thức 1: n = (N * n’)/ (N + n’)trong đó n: số lượng mẫu. N: dân số.n’ = [P’(1-P’)] / (SEp)2 với P’: tỉ lệ dân số có cùng đặc tính (ước lượng)và SEp : mức độ sai số chấp nhận được.Ví dụ: Một mẫu dân số có 2000 người, trong đó 62% có cùng đặc tính A, mức độ sai số chấp nhận được là 2%. Như vậy:n’ = [0,62 (1 – 0,62)] / (0,02)2 = (0,2356)/(0,0004) = 589.n = (2000*589)/(2000 + 589) = (2000 * 589)/2589 = 455.

Như vậy chúng ta chỉ cần lấy 455 mẫu thay vì 589.

Công thức 2: n = t2 * S2/L2 trong đó: t: tra từ bảng student ứng với mức 0,05 hoặc 0,01. Trong trường hợp gần đúng ta có thể chọn: t2 = 4 khi ở mức 0,05 và t2 = 7 khi ở mức 0,01.S2: phương sai và L: mức độ chính xác ước lượngVí dụ: Một quy trình sản xuất sơn có năng suất trung bình 20 tấn/ngày. Độ lệch chuẩn S = 3 tấn/ngày (qua theo dõi, và do năng suất thay đổi từng ngày). Nay thay đổi quy trình sản xuất mới. Hỏi cần theo dõi bao nhiêu ngày (n) để có thể ước lượng số trung bình thực của quy trình mới này trong khoảng ± 1,5 tấn/ngày (L), ứng với xác suất 95% và 99%.

- Ứng với 95% => n = 4 * 32/1,52 = 4*9/2,25 = 16 ngày.- Ứng với 99% => n = 7 * 32/1,52 = 7*9/2,25 = 32 ngày.

Dung lượng mẫu (n) theo các công thức trên hoàn toàn mang tính ước lượng. Thông thường trong thực tế, số lượng mẫu (n) thích hợp cho thống kê phải lớn hơn 30 mẫu và đương nhiên là càng nhiều càng tốt (tăng độ chính xác).

II.4. Kỹ thuật lấy mẫu điều tra

II.4.1. Lấy mẫu ngẫu nhiên (random sampling):

Lấy mẫu ngẫu nhiên là quá trình lựa chọn sao cho mỗi đơn vị lấy mẫu đêu có khả năng hiện diện trong mẫu như nhau. Lấy mẫu ngẫu nhiên có thể là lấy ngẫu nhiên có lập lại hoặc không lập lại. Trong thực tế, việc lấy mẫu ngẫu nhiên thường là không lập lại (rút thăm, dung bảng số ngẫu nhiên v.v..)

Ưu điểm: Việc lấy mẫu ngẫu nhiên => khách quan. Cách rút mẫu đơn giản, dễ tiến hành, dễ tính toán.

Khuyết điểm: Việc lấy mẫu ngẫu nhiên sẽ kém chính xác khi sự biến thiên của dân số rời rạc không theo quy tắc, hoặc khi đơn vị lấy mẫu phân bố trên diện rộng.

II.4.2. Lấy mẫu ngẫu nhiên phân tầng (lớp) (stratified random sampling).

Trong nghiên cứu, có những trường hợp tổng thể nghiên cứu (dân số) được cấu tạo bởi nhiều tập hợp khác nhau (không đồn nhất) nhưng có lien quan đến chỉ tiêu muốn nghiên cứu. Trong trường hợp này, tổng thể nghiên cứu phải được phân thành từng nhóm (tầng hay lớp) có những đặc đểm tương đồng trước khi tiến hành lấy mẫu. Lấy mẫu ngẫu nhiên phân tầng nghĩa là chọn mẫu ngẫu nhiên từ mỗi nhóm (tầng, lớp) đó trong tổng thể nghiên cứu. Số lượng mẫu cho mỗi tầng (lớp, nhóm) được xác định như sau:

- tầng thứ i: ni = n * pitrong đó pi: tỉ trọng cho lớp thứ I và n: là số lượng mẫu cho toàn thể.

Ưu điểm: Hiệu quả hơn lấy mẫu ngẫu nhiên vì đã đánh giá riêng cho từng lớp. Từ đó việc tính toán số liệu có thể vừa cho từng nhóm vừa cho tổng thể.

Khuyết điểm: Phương pháp chỉ có ý nghĩa khi có trước những thông tin cần thiết về tổng thể và mỗi nhóm phải có cấu trúc riêng.

II.4.3. Lấy mẫu hệ thống (systematic sampling):

Lấy mẫu có hệ thống là phương pháp chọn mẫu theo 1 trật tự nào đó từ tổng thể nghiên cứu. Ví dụ: Một lô cao su có 48 hàng cây, muốn lấy mẫu 8 hàng cây để xác định đường kính than cây chẳng hạn. Ta tiến hành như sau: gọi r là trật tự cần xác lập => r = 48/8 = 6. Như vậy cứ cách 6 hàng cây ta lấy 1 hàng cây lấy mẫu. hàng cây đầu tiên có thể chọn ngẫu nhiên từ 1 => 6 (hàng thứ 1 hoặc thứ 2 hoặc thứ 3 hoặc thứ 4 v.v…).

Ưu điểm: Sự lựa chọn mẫu được thực hiện dễ dàng, nhanh chóng và trải đều trên khắp tổng thể mẫu nghiên cứu.

Khuyết điểm: Phải xác định được số lượng và thứ tự của các đơn vị lấy mẫu. Điều này không phải lúc nào cũng có được trong tự nhiên

II.4.4. Lấy mẫu theo nhiều giai đoạn (multi- stage sampling):

Trong phương pháp này, việc chọn mẫu được tiến hành qua nhiều giai đoạn (khác với phương pháp chọn mẫu theo nhóm là nhiều bước chọn mẫu thay vì cùng lúc nhưng phân ra nhiều đặc diểm khác nhau).Ví dụ: Chọn vùng địa lý lớn (ví dụ: tỉnh, huyện), sau đó chọn mẫu ở vùng địa lý nhỏ hơn (ví dụ: huyện, xã), sau đó chọn số nông hộ trong từng huyện xã đó. Như vậy việc tiến hành chọn mẫu theo 3 giai đoạn: tỉnh (huyện) => huyện (xã) => nông hộ. Khuyết điểm của phương pháp chọn mẫu theo nhiều giai đoạn (hay theo nhóm) là cần có nhiều cá thể trong mẫu (mẫu phải lớn).

III. Các yếu tố và kỹ năng cơ bản:

Như đã trình bày, mục đích của việc điều tra nghiên cứu là thu thập dữ liệu từ những đối tượng khác một cách đầy đủ, chính xác, hữu hiệu. Để đạt được những yêu cầu trên đây, những yếu tố và những kỹ năng sau đây cần phải được xem xét và nâng cao hoàn thiện (kể cả việc phải tổ chức tập huấn) trước và trong khi tiến hành điều tra nghiên cứu.- Các yếu tố: (1) Tạo thuận tiện cho người được phỏng vấn, điều tra (Ví dụ: số câu hỏi vừa phải, có hệ thống, dễ hiểu, hoặc chuẩn bị sẳn các phương tiện để phản hồi cho chúng ta như là chuẩn bị sẳn phong bì, tem thư, địa chỉ ….)(2) Tận dụng nhưng không lệ thuộc vào các cán bộ có uy tín đang công tác tại địa phương để nắm rõ thong tin và tạo ấn tượng tốt lúc ban đầu.

(3) Nếu tiến hành điều tra theo nhiều nhóm thì tất cả các thành viên đều phải nắm rõ mục tiêu, có kỹ năng gần như nhau (nếu cần thì phải tập huấn) để việc thu thập thông tin được đồng đều, chính xác như nhau.(4) Thông tin thu thập phải được khẳng định giữ bí mật để không gây hoang mang cho những người được phỏng vấn (không thu thập thông tin bí mật riêng (họ tên, địa chỉ của người được phỏng vấn, hoặc tạo ấn tượng là đang thu thập thông tin cho 1 mục đích không rõ ràng như là thu thuế v.v.. => cần phải khẳng định rất rõ cho người được phỏng vấn). Tuy nhiên, trong 1 số trường hợp, thông tin riêng của người được phỏng vấn vẫn được phép thu thập để rà soát lại sau này.

- Các kỹ năng: (1) Kỹ năng giao tiếp (ngôn ngữ, cử chỉ, giọng điệu nói, tập quán v.v…) để việc trao đổi thông tin được rõ ràng, thuận lợi.(2) Kỹ năng tổ chức: Nhóm thực hiện điều tra cần phải biết tổ chức hợp lý khoa học để giảm chi phí, thời gian, công sức v.v..(3) Kỹ năng quan sát: mặc dù mọi việc đã được chuẩn bị từ trước. Tuy nhiên trong quá trình thực hiện có thể còn nhiều điều mới lạ mà chúng ta không đủ khả năng để lường trước được. Vì vậy, trong quá trình thực hiện cần có kỹ năng quan sát để khám phá những khác lạ xảy ra nhằm nâng cao, bổ sung hoặc khắc phục các thiếu sót trong quá trình chuẩn bị.IV. Tổ chức thực hiện:

Quy mô điều tra nghiên cứu mang tầm vóc rộng lớn đa dạng, cần được tiến hành thực hiện tương đối lâu dài, nhiều thành phần. Vì vậy cần phải được tổ chức thực hiện có quy cách để mang lại hiệu quả cao. Những vấn đề sau đây cần phải được quan tâm trong quá trình tổ chức thực hiện:

- Mọi thành viên phải hiểu rõ mục tiêu điều tra nghiên cứu 1 cách đồng nhất (nếu có sự hiểu khác nhau => thực hiện sẽ khác nhau, lệch lạc => số liệu không đồng đều, sai lệch => kém chính xác).

- Có sự phối hợp tốt (nhưng chúng ta phải chủ động, tránh thiên lệch của thành viên địa phương bênh vực khen chê về địa phương mình)với một số thành viên địa phương ở địa bàn điều tra để thuận tiện trong việc nắm đầy đủ thông tin.

- Chuẩn bị tốt về phương tiện thu thập dữ liệu (tài liệu, biểu mẫu, thiết bị máy móc (nếu có), ….)

- Phân nhóm hợp lý (tránh quá tải hoặc quá nhẹ công việc và để các thành viên có thể hỗ trợ hợp tác bổ sung cho nhau).

- Phân bổ mẫu điều tra hợp lý để thuận tiện đi lại (cuốn chiếu, tránh đi tới đi lui gây tốn kém về thời gian và tiền bạc)

- Điều kiện ăn ở, phương tiện đi lại (tạo thuận lợi cho nhóm thực hiện).- Thời điểm tiến hành điều tra phải thích hợp (người trả lời có thời gian và

thoải mái trong việc trao đổi, trả lời thông tin).

Ghi chú:(đính kèm theo là một số ví dụ về mẫu điều tra)(mẫu điều tra đính kèm chỉ mang tính tham khảo)

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAMĐộc lập – Tự do – Hạnh phúc

-----***-----

PHIẾU ĐIỀU TRA VỀ SẢN XUẤT VÀ THU MUA CACAO(dành cho nông dân)

(mục đích……..)

I. Thông tin chung:1. Họ và tên chủ hộ:…………………….Phái tính: …….2. Địa chỉ:…………………………………………………3. Điện thoại:……………………………………………..4. Diện tích đất nông nghiệp

II. Thông tin chi tiết:A. Thông tin về kỹ thuật:

1. Diện tích trồng cacao (ha):………Tên giống………..2. Nguồn giống mua từ đâu:………………………….3. Thời gian bắt đầu trồng cacao:………………………4. Phương thức trồng cacao: trồng xen [ ] trồng thuần [ ]5. Nếu trồng xen, thì trồng xen với cây gì?......................

6. Năng suất cacao (kg/ha): ……………………………7. Ông/bà (hay Anh/chị) có nhận xét gì về năng suất của cây trồng xen

sau khi trồng cacao không?...............8. Tình hình sâu bệnh:………………………………..9. Ông/bà (hay Anh/Chị) có sử dụng tan dư thực vật của cacao

(vỏ,trái,lá) làm phân xanh không?..................10. Ông/bà (hay Anh/Chị) có sử dụng tan dư thực vật của cacao

(vỏ,trái,lá) làm thức ăn gia súc không?..........11. Ông/bà (hay Anh/chị) có khó khăn gì trong việc trồng cacao

không?......................................................B. Thông tin về kinh tế:

1. Ông/bà (hay Anh/Chị) đánh giá thế nào về thu nhập trước khi trồng cacao: ………………………………………2. Ông/bà (hay Anh/Chị) đánh giá thế nào về thu nhập sau khi trồng cacao: ……………………………………….3. Ông/bà (hay Anh/chị) đánh giá thế nào về thị trường tiêu thụ cacao hiện nay? ................................................4. Ông/bà (hay Anh/chị) bán cacao cho ai?.......................................................5. Ông/bà (hay Anh/chị) đánh giá thế nào về giá cả?......................................6. Ông/bà (hay Anh/chị) có gặp khó khăn trong mua bán cacao không? Nếu có, vấn đề gì là quan trọng nhất? .................................................................................

C. Thông tin về các hỗ trợ:1. Ông/bà (hay Anh/chị) có nhận được bất kỳ sự hỗ trợ nào không? ...................từ nguồn nào?........................................................................................................2. Ông/bà (hay Anh/chị) cần những hỗ trợ gì cho việc phát triển cây cacao? ..............................................................................................................................………………………………………………………………………………….

III. Ý kiến đóng góp thêm:…………………..…………………………………………………………….…………………………………..…………………………………………….……………………………………………………………………………………………………………………………………………………………..………….

Ngày tháng năm Người phỏng vấn (hoặc người điều tra)

PHIẾU ĐIỀU TRA(mẫu chung dành cho đào tạo sinh viên học môn PPTN1)

A. Thông tin chung (tổng quát)1. Họ và tên người được phỏng vấn (điều tra)(nông hộ)

(có trường hợp không nên sử dụng)………………2. Địa chỉ (người được phỏng vấn)3. Tình trạng gia đình (số nhân khẩu, lao động chính, nam, nữ)4. Tình trạng học vấn (nếu cần thiết)5. Tình trạng sản xuất (diện tích canh tác, số mùa vụ, công cụ lao động)

B. Thông tin chi tiết1. Kỹ thuật canh tác từng mùa vụ (diện tích, giống, lịch canh tác, phân bón,

nước tưới, năng suất, nguồn cung cấp giống, tình hình sâu bệnh….)2. Chi phí sản xuất từng mùa vụ (giống, phân, thuốc, nước tưới, công lao

động, v.v...)3. Thu nhập (giá bán từng loại, từng thời điểm, phương thức thanh toán…)4. Các vấn đề khác (khuyến nông, tín dụng, thu mua, ….)

C. Góp ý chung

Ngày tháng năm Người phỏng vấn

Chương 3: Xử lý và phân tích dữ liệu

Nội dung:I. Tiến trình xử lý dữ liệuII. Hiệu chỉnh dữ liệuIII. Mã hóa dữ liệuIV. Phân tích và trình bày dữ liệu

IV.1. Định lượng (mô tả)IV.2. Thống kê

V. Vai trò tin học trong xử lý/phân tích và trình bày dữ liệu

Từ khóa: dữ liệu, xử lý dữ liệu, hiệu chỉnh dữ liệu, mã hoá dữ liệu, phân tích dữ lịệu, trình bày dữ liệu.Các vấn đề cần chú ý

1. Nắm rõ tiến trình xử lý dữ liệu2. Hiệu chỉnh và tổ chức dữ liệu cho phù hợp với mục tiêu cần phân tích 3. Vấn đề mã hoá dữ liệu4. Làm thế nào để trình bày dữ liệu hiệu quà.5. Ứng dụng tin học trong xử lý và phân tích/trình bày dữ liệu

I.Tiến trình xử lý dữ liệu: Câu hỏi đặt ra là sau khi việc thu thập thông tin đã hoàn tất, bước tiếp theo

đối với những thông tin này là gì? Làm thế nào tìm ra được những câu trả lời cho các vấn đề nghiên cứu? Làm thế nào để đánh giá ý nghĩa của thông tin thu thập được? Làm thế nào để công nhận hay phủ nhận giả thiết đặt ra? Và nhiều câu hỏi khác nữa. Như vậy, để trả lời những câu hỏi trên đây, chúng ta cần phải tiến hành các bước sau đây (xem hình 1)

Hình 1: Tiến trình xử lý dữ liệu

II. Hiệu chỉnh dữ liệu: Mục đích của việc hiệu chỉnh dữ liệu là để giảm thiểu các lỗi, các thiếu sót,

phân loại sai hay sự thiếu hụt thông tin (do không ghi hoặc ghi thiếu khi phỏng vấn, viết sai, viết không rõ ràng, v.v..).

Có 2 cách hiệu chỉnh dữ liệu:- Xem xét các câu trả lời cho từng câu hỏi (một câu hỏi và xem xét

nhiều người, nhiều câu trả lời)- Xem xét các câu trả lời cho mọi câu hỏi của 1 người (với 1 bảng trả

lời của 1 người trả lời, ta xem xét tất cả các câu trả lời của người đó).

III. Mã hóa dữ liệu: Sau khi làm sạch dữ liệu (hiệu chỉnh dữ liệu), bước kế tiếp là mã hóa dữ

liệu. Thông thường, việc phân tích dữ liệu cần đến việc áp dụng công nghệ thông tin. Do đó, dù dữ liệu là định tính hay định lượng thì cũng cần xây dựng việc mã hóa thông tin. Việc mã hóa dữ liệu thô liên quan đến 4 bước

1. Xây dựng sách mã hóa.2. Tìm kiếm thử sách mã3. Mã hóa dữ liệu4. Kiểm chứng dữ liệu đã được mã hóa

Xây dựng sách mã hóa.Sách mã hóa cung cấp các quy tắc để gán các giá trị số cho các câu trả lời. Điều này còn phụ thuộc vào việc trả lời các câu hỏi. Công việc này rất hữu ích cho những người mới bắt đầu công việc (xem ví dụ)

Số hiệu Số hiệu câu Tên biến Câu trả lời (4) Giá trị mã (5)

Dữ liệu thô Hiệu chỉnh Mã hóa Phân tích

- Phỏng vấn- Bảng câu hỏi- Các nguồn số liệu khác

Phát triển sách mã hóa

Mã hóa dữ liệu

Kiểm chứng dữ liệu đã mã hóa

Phát triển khung phân tích

Phân tích

- Máy tính (tin học)- Thủ công

cột (1) hỏi (2) (3)5 1 (a) AGE 20-24

25-2930-3435-3940-4445-49> 50Không trả lời

12345679

1 (c) EDU THPTĐại họcThạc sỹTiến sỹKhông trả lời

12349

2 STUDY Kinh tế/thương mạiGiáo dụcNghệ thuậtKhoa học tự nhiênNgoại ngữQuản lýKhông trả lời

1234569

Ghi chú: Số lượng mã tùy thuộc vào kiểu trả lời và mức độ nghiên cứu (chi tiết hay tổng quát)

Tìm kiếm thử sách mãMục đích là để kiểm tra các trở ngại, trục trặc có thể có trong quá trình mã hóa để điều chỉnh cho phù hợp

Mã hóa dữ liệuChuyển các trả lời phỏng vấn thô (định tính hoặc định lượng) sang dạng các mã số đã thiết lập trên đây.

Kiểm chứng dữ liệu đã được mã hóaKhi dữ liệu thô đã được mã hóa xong, kiểm tra lại 1 lần nữa để chắc chắn rằng không còn sai sót.

IV. Phân tích và trình bày dữ liệu: Dữ liệu sau khi được mã hóa có thể được phân tích bằng tay (thủ công) hoặc

bằng máy tính. Tuy nhiên việc phân tích thủ công mất rất nhiều thời gian (chỉ hữu ích khi khối lượng công việc ít, không có nhiều biến số để phân tích, số lượng mẫu nhỏ, việc phân tích tương đối đơn giản…). Tóm lại, việc phân tích dữ liệu nên được thực hiện bằng máy tính với những chương trình phù hợp.

Dữ liệu sau khi phân tích thông thường được trình bày dưới 2 dạng sau: Định lượng (hay mô tả) và thống kê.

IV.1. Định lượng: Có rất nhiều kiểu phụ trong việc trình bày dữ liệu dưới dạng miêu tả như sau:

1. Bảng biểu: là kiểu phổ biến nhất về dữ liệu đã qua phân tích. Bảng biểu là cách trình bày một lượng lớn các thông tin chi tiết với rất ít không gian yêu cầu (theo The Chicago Manual of Style – 1992). Có rất nhiều kiểu dạng bảng biểu để trình bày (xem ví dụ 1). Tuy nhiên, kiểu trình bày dưới dạng bảng biểu cũng có một số hạn chế là không sinh động (chưa cho chúng ta nhận biết biến động 1 cách dễ dàng). Vì vậy, người ta có thể dùng kiểu trình bày khác sinh động hơn là dạng biểu đồ (đồ thị).Ví dụ 1: Các kiểu bảng biểuKiểu 1: Bảng xxxx: Sự phân bố độ tuổi của những người trả lời (số liệu mang tính giả định)

Độ tuổi Số người trả lời< 20 tuổi20 – 2425 – 2930 – 3435 – 3940 – 4445 – 4950 – 54

≥ 55

2 ( 2.0)12 (12.0)22 (22.0)14 (14.0)17 (17.0)10 (10.0)11 (11.0)9 ( 9.0)3 (3.0)

Tổng cộng 100 (100.0)Ghi chú: số trong ngoặc đơn là tỉ lệ phần trăm.

Kiểu 2: (Bảng đối chiếu chéo)Bảng xxxx: Những người trả lời theo thái độ về việc khai thác mỏ Uranium và tuổi (số liệu mang tính giả định)Thái độ về việc khai thác mỏ Uranium

Tuổi< 25 25 - 34 35 - 44 45 – 54 ≥ 55 Tổng

cộngTán thành mạnh mẽ

(0.0)*0

(0.0)

(5.5)2

(12.5)

(14.8)4

(25.0)

(35.0)7

(43.6)

(100.0)3

(18.6)16

(100.0)Tán thành (0.0)

0(0.0)

(8.3)3

(25.0)

(18.5)5

(41.7)

(20.0)4

(33.3)

(0.0)0

(0.0)12

(100.0)Không chắc chắn

(0.0)0

(0.0)

(0.0)0

(0.0)

(7.4)2

(33.3)

(20.0)4

(66.7)

(0.0)0

(0.0)6

(100.0)Không tán thành

(14.3)2

(20.0)

(19.4)7

(70.0)

(3.7)1

(10.0)

(0.0)0

(0.0)

(0.0)0

(0.0)10

(100.0)

Phản đối mạnh mẽ

(85.7)12

(21.4)

(66.7)24

(42.9)

(55.6)15

(26.8)

(25.0)5

(8.9)

(0.0)0

(0.0)56

(100.0)Tổng cộng (100.0)

14(100.0)

36(100.0)

27(100.0)

20(100.0)

3(100.0)

100Ghi chú: *: phần trăm theo cột @: phần trăm theo hàng.

Bảng xxxx: Thái độ về việc khai thác Uranium theo tuổi và giới tính (số liệu mang tính giả định)Thái độ về việc khai thác Uranium

Số người trả lời Tổng cộng< 25 25 - 34 35 - 44 45 - 54 ≥ 55 Tổng

F M F M F M F M F M F M

Tán thành mạnh mẽ

0 0 1 1 3 1 5 2 3 - 12 4 16

Tán thành 0 0 1 2 3 2 3 1 0 0 7 5 12Không chắc chắn

0 0 0 0 1 1 2 2 0 0 3 3 6

Không tán thành

1 1 4 3 1 0 0 0 0 0 6 4 10

Phản đối mạnh mẽ

4 6 17 7 8 7 2 3 0 0 31 25 56

Tổng cộng 5 9 23 13 16 11 12 8 3 0 59 41 100

2. Biểu đồ: Dữ liệu thống kê không những yêu cầu phân tích cẩn thận mà còn yêu cầu trình bày phải có sức cuốn hút để dễ hiểu và dễ truyền đạt. Một trong những kiểu trình bày thỏa mãn các yêu cầu trên là dạng biểu đồ.

Tuy nhiên dạng biểu đồ cũng có rất nhiều cách để trình bày như sau: dạng hình chử nhật, dạng thanh, dạng thanh xếp chồng lên nhau, dạng diện tích, dạng điểm., dạng đường v.v.. (xem ví dụ 2)

Hình 1: Tỉ lệ Nam/Nữ theo lứa tuổi và theo thái độ khai thác Uranium

0

20

40

60

80

100

1 2 3 4 5 6theo thái độ

số n

gười

Nam Nữ

Hình 2: Tỉ lệ Nam/Nữ theo lứa tuổi và theo thái độ khai thác Uranium

0

10

20

30

40

50

60

70

1 2 3 4 5 6Theo thái độ

số n

gười

Nam Nữ

Ghi chú: 1: Tán thành mạnh mẽ2: Tán thành3: không chắc chắn4: không tán thành5: phản đối mạnh mẽ6: Tổng số người trả lời

Hinh 3: Diễn biến mưa và nhiệt độ theo tháng tại huyện A

0

100

200

300

400

500

tháng

Mưa

(mm

)

0

5

10

15

20

25

30

35

(oC)

Mưa

Nhiệt độ

Hình 4: Quan hệ giữa số nhánh và Năng suất

y = 9.5136x + 3430.4R2 = 0.9534

0

1000

2000

3000

4000

5000

6000

7000

0 50 100 150 200 250 300số nhánh

năng

suất

(kg/

ha)

Tỉ lệ các chi phí trong sản xuất Lúa

60%10%

20%

2%

8% Phân bónCôngThuốcNướcKhác

IV.2. Thống kê

Dữ liệu điều tra sau khi đã được xử lý, hiệu chỉnh, có thể được phân tích theo hướng thống kê như sau:

IV.2.1. Kiểm tra giả thiết thống kê: Có 2 cách kiểm tra giả thiết thống kê là (a) Kiểm tra tính độc lập và (b) So sánh trung bình. Tuy nhiên, trong bài này, chúng tôi chỉ trình bày việc kiểm tra tính độc lập (test for independence) hay còn gọi là Chi square (Χ2)Các bước tiến hành như sau:

- Đặt giả thiết Ho: xem xét hai (2) dấu hiệu là độc lập với nhau.- Tính tổng cùa hàng (R), tổng của cột (C), và tổng chung (G).- Tính tần số lý thuyết (fe) tương ứng với mỗi tần số quan sát (fo) cho

các ô trong bảngFe (ij) = (Ri * Cj)/G với I = 1 …r, và j = 1…..c.- Tính giá trị Χ2 theo công thức sau:Χ2 = ΣΣ(fo-fe)2/fe- So sánh giá trị Χ2 tính với Χ2 tra bảng (xem phụ lục..) ứng với

mức ý nghĩa α và độ tự do df.- Chấp nhận giả thiết Ho nếu Χ2 tính < Χ2 tra bảng- Bác bỏ giả thiết nếu Χ2 tính > Χ2 tra bảng

Trên đây là các bước lý thuyết trong việc kiểm tra giả thiết tính độc lập của 2 dấu hiệu (để tham khảo).

Trong thực tế, việc tính toán được dựa vào các phần mềm thống kê (statistical software). Sau đây là 1 vài ví dụ minh họa (dùng phần mềm thống kê MSTATC)

Ví dụ 1: Để đánh giá chất lượng sinh trưởng của cây trồng có phụ thuộc vào địa hình hay không? Người ta tiến hành điều tra ở 3 dạng địa hình khác nhau. Kết quả tu được như trong bảng sau:

Bảng …: Kết quả điều tra tình hình sinh trưởng của cây trồng

Chất lượng câyLoại địa hình

Tốt Trung bình Xấu Tổng (R)

- Sườn núi dốc- Bằng phẳng- Ven biển

90 170 40120 180 50 80 150 60

300 350 290

Tổng (C) 290 500 150 Tổng (G) 940

Giả thiết Ho đặt ra là chất lượng sinh trưởng của cây không phụ thuộc vào loại địa hình (hay là các dạng địa hình không ảnh hưởng đến chất lượng cây trồng).

Kết quả tính toán cho thấy Χ2 tính = 9,65 (sinh viên tự xem công thức để tính toán). Giá trị này lớn hơn Χ2 bảng (ứng với độ tự do df = 4 và mức α = 0,05 => Χ2 bảng = 9,49)(xem phụ lục đính kèm).

Như vậy, vì Χ2 tính > Χ2 bảng => bác bỏ giả thiết Ho. Nói cách khác là địa hình có ảnh hưởng đến chất lượng cây trồng.

IV.2.2. So sánh trung bình: dùng để so sánh trung bình và biến động giữa 2 nghiệm thức. Để so sánh, người ta thường áp dụng F-test (khi số lượng mẫu giữa 2 nghiệm thức là tương đồng, bằng nhau, do đó còn gọi là so sánh bắt cặp) hoặc thông dụng nhất là kiểu T-test (khi số lượng mẫu giữa 2 nghiệm thức không bằng nhau, không tương đồng).

Trình tự tiến hành cụ thể được diễn giảng trong phần thực hành trên phần mềm MSTATC.

IV.2.3. Tương quan: Trình tự tiến hành cụ thể được diễn giảng trong phần thực hành trên phần mềm MSTATC hoặc EXCEL.

IV.2.4. Trình bày kết quả thống kê

V. Vai trò tin học trong phân tích dữ liệu:

Như đã trình bày, việc phân tích và trình bày dữ liệu có thể thực hiện theo hai hướng: thủ công và máy tính. Tuy nhiên, rõ ràng rằng, việc phân tích theo hướng thủ công tốn rất nhiều thời gian, bất tiện trong quá trình chỉnh sửa, thay đổi kiểu trình bày, lưu trữ dữ liệu v.v.. Tóm lại, hiện nay việc phân tích và trình bày thường được thực hiện trên máy tính. Điều đó cho thấy, vai trò tin học trong việc nhập, xử lý, phân tích và trình bày dữ liệu điều tra là rất lớn. Chúng ta cần phải nâng cao kỹ năng ứng dụng tin học trong công tác này một cách thường xuyên.