74
Bài giảng hướng dẫn thực hành SPSS Phan Thanh Hồng - Nguyễn Thị Nhung Tháng 5 năm 2010

Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Embed Size (px)

Citation preview

Page 1: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài giảnghướng dẫnthực hành

SPSSPhan Thanh Hồng - Nguyễn Thị Nhung

Tháng 5 năm 2010

Page 2: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Mục lục

Trang

Bài 1. Xử lí dữ liệu trên SPSS 11.1 Giới thiệu và cài đặt phần mềm SPSS . . . . . . . . . . . . . . . . . . . . . . 1

1.1.1 Giới thiệu phần mềm SPSS . . . . . . . . . . . . . . . . . . . . . . . . 11.1.2 Cài đặt SPSS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.1.3 Khởi động SPSS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Nhập dữ liệu trong SPSS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.3 Đọc dữ liệu từ những file có sẵn trong SPSS . . . . . . . . . . . . . . . . . . . 9

1.3.1 Đọc dữ liệu từ file .sav . . . . . . . . . . . . . . . . . . . . . . . . . . 91.3.2 Đọc dữ liệu từ file .xls . . . . . . . . . . . . . . . . . . . . . . . . . . 101.3.3 Đọc dữ liệu từ file.txt . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.4 Lọc dữ liệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141.5 Mã hóa dữ liệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

1.5.1 Mã hóa dữ liệu trong nội bộ biến . . . . . . . . . . . . . . . . . . . . . 201.5.2 Mã hóa dữ liệu vào biến mới . . . . . . . . . . . . . . . . . . . . . . . 23

1.6 Làm sạch dữ liệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261.6.1 Dùng bảng tần số . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271.6.2 Dùng lệnh Sort case để tìm dữ liệu sai trên cửa sổ Data View . . . . . . 281.6.3 Dùng bảng phối hợp hai biến hay ba biến . . . . . . . . . . . . . . . . 28

Bài 2. Lập bảng tần số và tính các đại lượng thống kê mô tả 302.1 Tóm tắt dữ liệu bằng bảng tần số . . . . . . . . . . . . . . . . . . . . . . . . . 30

2.1.1 Bảng tần số cho dữ liệu định tính và dữ liệu định lượng có ít biểu hiện . 302.1.2 Phân tổ dữ liệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

2.2 Lập bảng tổng hợp nhiều biến . . . . . . . . . . . . . . . . . . . . . . . . . . 322.2.1 Bảng kết hợp hai biến định tính . . . . . . . . . . . . . . . . . . . . . 322.2.2 Bảng kết hợp ba biến định tính . . . . . . . . . . . . . . . . . . . . . . 342.2.3 Bảng kết hợp một biến định tính và một biến định lượng . . . . . . . . 35

2.3 Tính các đại lượng thống kê mô tả . . . . . . . . . . . . . . . . . . . . . . . . 362.3.1 Bài tập ôn luyện . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

Bài 3. Biểu đồ 41

i

Page 3: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Mục lục

3.1 Một số loại biểu đồ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413.2 Biểu đồ thanh . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

3.2.1 Cách vẽ biểu đồ thanh . . . . . . . . . . . . . . . . . . . . . . . . . . 413.2.2 Ví dụ: vẽ biểu đồ thanh biểu diễn một biến . . . . . . . . . . . . . . . 433.2.3 Ví dụ: vẽ biểu đồ thanh biểu diễn một biến được phân tách bởi một biến

khác . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433.3 Biểu đồ tròn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

3.3.1 Cách vẽ biểu đồ tròn . . . . . . . . . . . . . . . . . . . . . . . . . . . 453.4 Biểu đồ gấp khúc, diện tích (Line, Area Chart) . . . . . . . . . . . . . . . . . . 46

3.4.1 Ví dụ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 463.4.2 Ví dụ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

3.5 Biểu đồ tần số (Histogram) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 483.5.1 Cách vẽ biểu đồ tần số (Histogram) . . . . . . . . . . . . . . . . . . . 49

3.6 Biểu đồ hộp và râu (Boxplot) . . . . . . . . . . . . . . . . . . . . . . . . . . . 513.6.1 Cách vẽ biểu đồ hộp và râu (Boxplot) . . . . . . . . . . . . . . . . . . 51

3.7 Biểu đồ tán xạ (Scatter plot) . . . . . . . . . . . . . . . . . . . . . . . . . . . 543.7.1 Cách vẽ biểu đồ tán xạ (Scatter plot) . . . . . . . . . . . . . . . . . . . 54

Bài 4. Kiểm định mối quan hệ giữa hai biến 564.0.2 Ví dụ: kiểm định mối liên hệ hai biến định danh, hay định danh-thứ bậc 564.0.3 Kiểm định mối liên hệ hai biến thứ bậc . . . . . . . . . . . . . . . . . 59

Bài 5. Kiểm định về trung bình 615.1 Kiểm định về trung bình một tổng thể . . . . . . . . . . . . . . . . . . . . . . 615.2 Kiểm định về sự khác nhau của hai trung bình của hai tổng thể khi mẫu độc lập 625.3 Kiểm định về sự khác nhau của hai trung bình của hai tổng thể khi mẫu cặp . . 64

Bài 6. Phân tích phương sai (ANOVA) 676.0.1 Ví dụ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 676.0.2 Phân tích sâu ANOVA . . . . . . . . . . . . . . . . . . . . . . . . . . 69

Tài liệu tham khảo 71

ii P.T.Hồng-N.T.Nhung

Page 4: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 1

Xử lí dữ liệu trên SPSS

1.1 Giới thiệu và cài đặt phần mềm SPSS

Giới thiệu phần mềm SPSS

SPSS (viết tắt của Statistical Package for the Social Sciences) là một chương trình máy tínhphục vụ công tác thống kê. SPSS được sử dụng rộng rãi trong công tác thống kê xã hội.

Thế hệ đầu tiên của SPSS được đưa ra từ năm 1968. Thế hệ mới nhất là thế hệ 18 được giớithiệu từ tháng 8 năm 2008, có cả phiên bản cho các hệ điều hành Microsoft Windows, Mac, vàLinux / UNIX.

SPSS là một hệ thống phần mềm thống kê toàn diện được thiết kế để thực hiện tất cả cácbước trong các phân tích thống kê từ những tính toán trong thống kê mô tả (liệt kê dữ liệu, lậpbảng tần số, lập biểu đồ, tính các đại lượng thống kê mô tả,...) đến thực hiện những bài toántrong thống kê suy diễn (kiểm định, tương quan, hồi qui, ...)

Cài đặt SPSS

Cho đến nay, SPSS có rất nhiều phiên bản khác nhau, phiên bản mới nhất (5/2010) là phiênbản 18.0. Với những tính toán thống kê phổ biến ta có thể cài SPSS với một trong các phiênbản 13.0, 14.0 hay 16.0, ... Tất cả các phân tích trong tài liệu này được thực hiện trên phiên bảnSPSS 13.0.

Khởi động SPSS

Để khởi động SPSS ta có thể thực hiện theo những cách sau:

• Kích đúp vào biểu tượng SPSS trên màn hình;

• Vào StartÑ ProgramÑ SPSS for WindowsÑ SPSS 13.0 for Windows

Sau khi khởi động, ta được giao diện sau:

Page 5: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 1. Xử lí dữ liệu trên SPSS

1.2 Nhập dữ liệu trong SPSS

Để nhập một tập dữ liệu vào SPSS, ta thực hiện như sau:Bước 1: Tại cửa sổ SPSS DaTa Editor, ta ấn vào nút Variable View để khai báo thông tin

về các thuộc tính của từng biến trong file dữ liệu.Trong một bảng Variable View

• Các hàng là các biến;

• Các cột là các thuộc tính của biến.

Các thuộc tính của một biến bao gồm:

• Tên biến (Name)

• Loại dữ liệu (Type)

• Số lượng con số hoặc chữ (Width)

• Số lượng chữ số thập phân (Decimals)

• Mô tả biến/nhãn biến (Lable) và nhãn trị số biến (Values)

2 P.T.Hồng-N.T.Nhung

Page 6: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

1.2. Nhập dữ liệu trong SPSS

• Các giá trị khuyết thiếu do người sử dụng thiết lập (Missing)

• Độ rộng của cột (Columns)

• Căn lề (Align)

• Thang đo của biến (Measure)

Khi khai báo hoặc chỉnh sửa các thuộc tính của biến trong cửa sổ Variable View cần chú ýmột số điểm sau:

• Tên biến phải bắt đầu bằng một chữ cái và không được kết thúc bằng một dấu chấm. Têncủa biến là duy nhất, không được đặt trùng tên biến và tên biến không phân biệt chữ hoa,chữ thường.

• Loại biến: Variable Type xác định loại dữ liệu đối với từng biến. Theo mặc định, mọibiến mới được giả sử là dạng số. Phụ thuộc vào loại dữ liệu được thu thập, ta có thể khaibáo dưới những kiểu sau: dữ liệu là dạng số (numeric), dấu phảy (comma), dấu chấm(dot), ghi chú khoa học (Scientific notation), ngày tháng (Date), đô-la (Dollar), đơn vịtiền riêng (custom currency) và chuỗi (string).

• Nhãn của biến dùng để mô tả rõ hơn về tên của biến do tên của biến chỉ có độ dài tối đalà 8. Nhãn của biến có thể có độ dài đến 256 kí tự.

• Ta có thể gán nhãn cho từng giá trị của biến. Tính năng này đặc biệt tiện lợi khi ta dùngcác số để mã hóa các biến định tính. Ví dụ.... Biến được mã hóa như vậy có thể dùng chonhiều phân tích khác nhau. Hơn nữa, với nhãn của các giá trị, kết quả tính ra sẽ được trìnhbày rõ ràng hơn.

• Các giá trị khuyết thiếu do người sử dụng thiết lập (Missing). Những giá trị không thíchứng với kiểu khai báo của biến sẽ được coi là giá trị khuyết thiếu. Đối với biến kiểu số,các ô trống được hiểu là giá trị khuyết và được đánh dấu bằng dấu phân cách thập phân.Nhiều thủ tục trong SPSS sẽ loại các giá trị khuyết ra khỏi các bước tính toán và các kếtquả phân tích chỉ dựa trên phần số liệu không khuyết.

– Ta có thể nhập đến 3 trị số khuyết riêng biệt, một phạm vi khoảng cách trị số khuyếthoặc một phạm vi cộng với một trị số khuyết riêng biệt;

– Các phạm vi có thể được chỉ định cho các biến dạng số;

– Các trị số khuyết cho các biến dạng chuỗi phải có độ dài không vượt quá 8 kí tự.

• Số đo của biến có thể ở thang đo định danh (Nominal), thang đo thứ bậc (Ordinal) hoặcthang đo khoảng, tỉ lệ (gọi chung là Scale):

– Thang đo định danh: Thang đo định danh dùng cho các biến định tính. Số đo củacác biến này là các mã số để phân loại đối tượng. Giữa các mã số ở đây không cóquan hệ hơn kém, chỉ dùng để đếm tần số xuất hiện của các biểu hiện. Một số ví dụvề thang đo này là: biến giới tính với các số đo là: Nam hoặc Nữ; biến màu sắc vớisố đo là: xanh, đỏ, tím, vàng,...; biến khu vực sống với các số đo: Thành phố, Thịxã, Nông thôn, Miền núi,...

P.T.Hồng-N.T.Nhung 3

Page 7: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 1. Xử lí dữ liệu trên SPSS

– Thang đo thứ bậc: Thang đo thứ bậc thường dùng cho các biến định tính, đôi khidùng cho cả biến định lượng. Trong thang đo này giữa các số đo của các biến cóquan hệ thứ bậc hơn kém. Tuy nhiên, sự chênh lệch giữa các số đo không nhất thiếtbằng nhau. Ví dụ biến đánh giá thái độ đối với chất lượng dịch vụ mạng Internet tạinhà có số đo là: Không hài lòng, hài lòng, rất hài lòng.

– Thang đo khoảng: Thang đo thứ bậc thường dùng cho các biến định lượng. Thangđo khoảng là thang đo thứ bậc có các khoảng cách đều nhau. Các phép tính cộng trừđều có nghĩa nhưng không có giá trị không xác định một cách chính xác và khôngthể lấy tỉ lệ giữa các số đo. Ví dụ số đo nhiệt độ, số đo chỉ số IQ, chỉ số EQ,...

– Thang đo tỉ lệ: Thang đo tỉ lệ dùng cho các biến định lượng. Thang đo tỉ lệ là thangđo khoảng, hơn nữa thang đo này có giá trị không xác định một cách chính xác vàcó thể lấy tỉ lệ giữa các số đo. Ví dụ về thang đo này đơn vị đo tiền tệ (VND, dollar,pound, yen,...); đơn vị đo chiều dài (cm, m, km,...); đơn vị đo khối lượng (kg, tấn,tạ, yến,...).

Bước 2: Tại cửa sổ Data Editor, nhấn vào nút Data View để nhập từng dữ liệu trong mỗiô. Trong bảng Data View

• Mỗi cột là mỗi biến Variable;

• Mỗi hàng là một đối tượng cases.

Để chèn một đối tượng (hàng) mới giữa các đối tượng đã có sẵn:

• Trong bảng Data View, chọn bất kì ô nào trong đối tượng nằm dưới vị trí cần chèn đốitượng mới;

• Từ thanh menu chọn DataÑ Insert Cases.

Để chèn một biến (cột) mới vào các biến đã có sẵn:

• Trong bảng Data View, chọn bất kì ô nào trong biến nằm bên phải biến cần chèn biến mới;

• Từ thanh menu chọn DataÑ Insert Variable.

Giả sử ta đang muốn nhập một tập dữ liệu về điều tra thị trường thức ăn nhanh FastFood đượccho trong bảng dưới đây vào trong SPSS:

4 P.T.Hồng-N.T.Nhung

Page 8: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

1.2. Nhập dữ liệu trong SPSS

Đối với tập dữ liệu trên ta có 9 biến là: Tuoi (tuổi), GioiTinh (giới tính), NgheNghiep (nghềnghiệp), ThuNhap (thu nhập), Gia (giá mua FastFood), ChonDoQC, ChonDoTL, ChonDoSP,ChonDoGC (yếu tố ảnh hưởng đến quyết định dùng FastFood tương ứng là do quảng cáo, tiệnlợi, sản phẩm, giá cả) thu thập trên 100 đối tượng.

Để nhập tập dữ liệu này vào trong SPSS, đầu tiên ta vào bảng Variable View để khai báocác thuộc tính của các biến. Chẳng hạn, với biến Tuoi ta khai báo các thuộc tính như sau:

• Name: Tuoi

• Type: Numeric (dạng số)

• Width: 2 (độ dài mỗi giá trị tuổi là 2)

• Decimals: 0 (không có chữ số thập phân)

• Lable: (không chú thích gì thêm về biến)

• Values: None (không cần giải thích gì về kiểu giá trị của biến)

• Missing: None (không có giá trị khuyết)

• Columns: 8 (độ rộng của cột biến là 8)

• Align: Right (căn lề bên phải)

• Measure: Scale (giá trị của biến là tuổi ở thang đo tỉ lệ nên khai báo là ở thang đo địnhlượng)

P.T.Hồng-N.T.Nhung 5

Page 9: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 1. Xử lí dữ liệu trên SPSS

Với biến NgheNghiep ta khai báo các thuộc tính như sau:

• Name: NgheNghiep

• Type: String (dạng chuỗi)

• Width: 4 (độ dài mỗi giá trị về nghề nghiệp là 4)

• Decimals: 0 (không có chữ số thập phân)

• Lable: Nghe nghiep (chú thích thêm về tên biến)

• Values: HSSV = "hoc sinh + sinh vien", CNVC = "cong nhan vien chuc", NVVP = "nhanvien van phong", Khac = "nghe khac" (chú thích thêm về từng giá trị của biến)

• Missing: None (không có giá trị khuyết)

• Columns: 8 (độ rộng của cột biến là 8)

• Align: Left (căn lề bên trái)

• Measure: Nominal (giá trị của biến là nghề nghiệp ở thang đo định danh nên khai báo làở thang đo định danh)

Với biến Gia ta khai báo các thuộc tính như sau:

• Name: Gia

• Type: Numeric (dạng số)

• Width: 1 (độ dài mỗi giá trị về nghề nghiệp là 4)

• Decimals: 0 (không có chữ số thập phân)

• Lable: Gia mua FastFood (chú thích thêm về tên biến)

• Values: 1 = "12-20 (nghin)", 2 = "20-30 (nghin)", 3 = "30-40 (nghin)", 4 = "> 40 (nghin)"(chú thích về từng giá trị của biến)

6 P.T.Hồng-N.T.Nhung

Page 10: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

1.2. Nhập dữ liệu trong SPSS

• Missing: None (không có giá trị khuyết)

• Columns: 8 (độ rộng của cột biến là 8)

• Align: Left (căn lề bên trái)

• Measure: Ordinal (giá trị của biến là giá ở thang đo thứ bậc nên khai báo là ở thang đothứ bậc)

Hoàn toàn tương tự cho các biến khác ta có được bảng Variable View cho 9 biến như sau:

Sau khi đã khai báo các thuộc tính của các biến trong cửa sổ Variable View, ta vào cửa sổData View nhập giá trị cho từng biến như đã được điều tra.

P.T.Hồng-N.T.Nhung 7

Page 11: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 1. Xử lí dữ liệu trên SPSS

Để lưu dữ liệu vừa được tạo ra dưới đuôi của SPSS .sav, ta vào FileÑ Save as để đánh tênfile cần lưu và thư mục để lưu trong máy tính.

8 P.T.Hồng-N.T.Nhung

Page 12: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

1.3. Đọc dữ liệu từ những file có sẵn trong SPSS

1.3 Đọc dữ liệu từ những file có sẵn trong SPSS

SPSS có thể đọc dữ liệu từ rất nhiều kiểu file khác nhau. Ngoài dữ liệu dưới dạng file.savcủa SPSS, SPSS còn cho đọc file dữ liệu dưới một số dạng thông dụng như file.xls (Excel File),file.txt (Text File) và file dữ liệu tạo ra từ một số phần mềm thống kê khác như file.dta (StataFile), file.wf1 (Eviews Workfile), ...

Đọc dữ liệu từ file .sav

Để đọc dữ liệu từ một file.sav, chẳng hạn file dữ liệu DuLieuFastFood.sav, ta vào FileÑOpenÑ Data và chọn đến thư mục để file dữ liệu và mở file:

P.T.Hồng-N.T.Nhung 9

Page 13: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 1. Xử lí dữ liệu trên SPSS

Đọc dữ liệu từ file .xls

Để đọc dữ liệu từ một file.xls, chẳng hạn file dữ liệu DuLieuFastFood.xls, ta vào FileÑOpenÑ Data và chọn đến thư mục để file dữ liệu và mở file:

Khi cửa sổ hiện ra hộp thoại sau ta ấn vào OK là mở được dữ liệu vào SPSS:

10 P.T.Hồng-N.T.Nhung

Page 14: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

1.3. Đọc dữ liệu từ những file có sẵn trong SPSS

Đọc dữ liệu từ file.txt

Để đọc dữ liệu từ một file.txt, chẳng hạn file dữ liệu DuLieuFastFood.txt, ta vào FileÑOpenÑ Data và chọn đến thư mục để file dữ liệu và mở file:

Khi màn hình trên hiện ra hộp thoại sau ta ấn vào Open để mở file dữ liệu vào SPSS. Khi hiệnra cửa sổ sau ta ấn Next:

P.T.Hồng-N.T.Nhung 11

Page 15: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 1. Xử lí dữ liệu trên SPSS

Khi trên màn hình hiện ra hộp thoại sau ta chọn Yes cho câu hỏi Are variable names includeat the top of your file? và sau đó ấn vào Next:

Khi trên màn hình hiện ra hộp thoại sau ta ấn vào Next:

12 P.T.Hồng-N.T.Nhung

Page 16: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

1.3. Đọc dữ liệu từ những file có sẵn trong SPSS

Khi trên màn hình hiện ra hộp thoại sau ta ấn vào Next:

Khi trên màn hình hiện ra hộp thoại sau ta ấn vào Next:

P.T.Hồng-N.T.Nhung 13

Page 17: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 1. Xử lí dữ liệu trên SPSS

Và cuối cùng khi trên màn hình hiện ra hộp thoại sau ta ấn vào Finish:

1.4 Lọc dữ liệu

SPSS cho phép ta lọc ra một nhóm các quan sát thỏa mãn những điều kiện nhất định. Nhómcon các quan sát có thể rút ra ngẫu nhiên, hoặc chọn theo số thứ tự các quan sát, khoảng giớihạn về thời gian, giá trị và khoảng giới hạn của một biến, theo một biểu thức số học, một biểuthức logic hay một hàm số học nào đó. Để tiến hành lọc dữ liệu, ta vào DataÑ Select Cases...và trên màn hình hiện ra hộp thoại:

14 P.T.Hồng-N.T.Nhung

Page 18: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

1.4. Lọc dữ liệu

Với hộp thoại này, ta sử dụng các nút trong khung Select để ấn định cách lọc dữ liệu. Ta có thểchọn một trong các khả năng sau:

• Đưa tất cả các quan sát vào phân tích thì ấn nút All cases (mặc định);

• Chọn một số quan sát thỏa mãn một số điều kiện nhất định thì ấn nút If condition issatisfied để cho phím If nổi lên rồi ấn phím đó. Khi đó hộp thoại sau sẽ hiện ra:

Trên hộp thoại này, ta thiết lập một biểu thức so sánh trong khung bên phải hộp thoạibằng cách kết hợp các biến từ khung danh sách biến phía bên trái, các hàm số trong khungFunctions góc dưới bên phải cùng các phím số, phím phép tính số học, phép so sánh,phép tính logic trong khung hộp thoại hoặc từ bàn phím:

Phép toán số học Phép toán so sánh Phép toán logic+ cộng < nhỏ hơn � phủ định- trừ > lớn hơn & và� nhân <= nhỏ hơn hoặc bằng | hoặc/ chia >= lớn hơn hoặc bằng

= bằng�= khác

P.T.Hồng-N.T.Nhung 15

Page 19: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 1. Xử lí dữ liệu trên SPSS

Chẳng hạn, để lọc ra dữ liệu về nam trong tập dữ liệu tại khung của hộp thoại ta đánh biểuthức logic GioiTinh = "Nam" và ấn nút Continue:

Khi đó màn hình hiện ra hộp thoại:

Để loại đi những dữ liệu về nữ ra khỏi tập dữ liệu tại khungUnselected Cases Are ta chọnDeleted và ta được thông tin về nam giới được điều tra trong tập dữ liệu:

16 P.T.Hồng-N.T.Nhung

Page 20: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

1.4. Lọc dữ liệu

Nếu ta muốn lọc ra dữ liệu về nam có độ tuổi lớn hơn 50 trong tập dữ liệu tại khung củahộp thoại ta đánh biểu thức logic GioiTinh = "Nam" & Tuoi > 50 và ấn nút Continue:

Khi đó màn hình hiện ra hộp thoại:

P.T.Hồng-N.T.Nhung 17

Page 21: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 1. Xử lí dữ liệu trên SPSS

Nếu chỉ muốn lọc riêng ra những thông tin về nam giới và có độ tuổi trên 50, tại khungUnselected Cases Are ta chọn Deleted và ta được:

• Để lấy ra một mẫu ngẫu nhiên từ tổng thể quan sát ta ấn nút Random sample of cases đểcho phím Sample hiện lên và ấn vào nút đó. Sau đó màn hình hiện tiếp ra hộp thoại sau:

Trên hộp thoại này, ta có thể

– Ấn Approximately rồi điền một số nguyên từ 1 đến 99 vào ô trống để chỉ phần trămsố phần tử trong mẫu so với số phần tử của toàn bộ tổng thể;

18 P.T.Hồng-N.T.Nhung

Page 22: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

1.4. Lọc dữ liệu

– Ấn Exactly rồi điền một số nguyên k trong ô trống liền bên cạnh và một số nguyênn lớn hơn trong ô trống tiếp theo để tạo ra một mẫu gồm k quan sát được rút ra ngẫunhiên nhiên từ n quan sát đầu tiên của tập số liệu.

Chẳng hạn ta muốn chọn ra ngẫu nhiên 20 người được điều tra từ 100 người trongbảng dữ liệu, ta điền 20 và 100 vào hai ô trống trong nútExactly rồi ấn nútContinue:

Khi màn hình hiện tiếp ra hộp thoại sau thì ấn OK:

và ta được tập dữ liệu gồm thông tin của 20 người trong mẫu:

P.T.Hồng-N.T.Nhung 19

Page 23: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 1. Xử lí dữ liệu trên SPSS

1.5 Mã hóa dữ liệu

Trong quá trình phân tích, nhiều trường hợp ta phải mã hóa lại các giá trị của biến vì mộtmục đích nào đó. Ta có thể mã hóa lại các giá trị trong nội bộ một biến có sẵn hoặc lập một biếnmới để chứa các giá trị được mã hóa lại.

Mã hóa dữ liệu trong nội bộ biến

Ta có thể tiến hành mã hóa lại các biến kiểu số hoặc các biến kiểu chuỗi kí tự. Nếu muốnmã hóa lại đồng thời nhiều biến một lúc, các biến đó phải có cùng kiểu số hoặc cùng kiểu chuỗikí tự. Để thực hiện việc mã hóa dữ liệu trong nội bộ biến ta vào TransformÑ RecodeÑ IntoSame Variables... và màn hình hiện ra hộp thoại:

20 P.T.Hồng-N.T.Nhung

Page 24: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

1.5.Mã hóa dữ liệu

Chẳng hạn, ta định mã hóa lại các giá trị trong biến tuổi thành các khoảng tuổi

¤ 14 14� 24 24� 45 45� 60 ¡ 60

ta thực hiện như sau:

• Chọn từ khung bên trái biến Tuoi để đưa vào khung Variable phía bên phải;

• Nhấn phím Old and New Values để qui định cách mã hóa biến Tuoi và hộp thoại sau sẽhiện ra:

• Trong hộp thoại này để phân khoảng mã hóa ta ấn nút Range trong Old Value thiết lậpcác khoảng và thay thế bằng các giá trị mã hóa mới trong New Value rồi ấn nút Add đểchuyển cách mã hóa vào khung OldÑ New:, cụ thể như sau:

Khoảng tuổi Old Value New Value¤ 14 Range: Lowest through 14 1

14� 24 Range: 14 though 24 224� 45 Range: 24 though 45 345� 60 Range: 45 though 60 4¡ 60 Range: 60 though highest 5

Khi màn hình hiện ra hộp thoại sau ta ấn Continue

• Cuối cùng khi màn hình hiện ra hộp thoại sau thì ta ấn OK:

P.T.Hồng-N.T.Nhung 21

Page 25: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 1. Xử lí dữ liệu trên SPSS

• Và ta được tập dữ liệu với biến tuổi đã được mã hóa:

Để mã hóa hai biến định tính là GioiTinh và NgheNghiep, ta cũng tiến hành làm tương tự:

• Chọn từ khung bên trái biến GioiTinh va NgheNghiep để đưa vào khung Variable phíabên phải;

• Nhấn phímOld and New Values để qui định cách mã hóa biến GioiTinh và NgheNghiepvà khi hộp thoại mã hóa hiện ra ta ấn nút Value trong Old Value thiết lập các giá trị cũđược thay thế bằng các giá trị mã hóa mới trong New Value rồi ấn nút Add để chuyểncách mã hóa vào khung OldÑ New:, cụ thể như sau:

22 P.T.Hồng-N.T.Nhung

Page 26: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

1.5.Mã hóa dữ liệu

Old Value New ValueNam 1Nu 0

HSSV 1CNVC 2NVVP 3Khac 4

Khi màn hình hiện ra hộp thoại sau ta ấn Continue và sau đó thì ấn Ok.

• Và ta được tập dữ liệu với hai biến GioiTinh và NgheNghiep đã được mã hóa:

Mã hóa dữ liệu vào biến mới

Ta có thể mã hóa lại một biến đã có sẵn và lập một biến mới để chứa các giá trị mới đượcmã hóa lại. Ta có thể mã hóa biến kiểu số hoặc biến kiểu kí tự, có thể chuyển một biến kiểu sốthành biến kiểu chuỗi kí tự và ngược lại chuyển biến kiểu chuỗi kí tự thành biến kiểu số. Nếumuốn mã hóa lại nhiều biến một lúc, các biến đó phải cùng kiểu số hoặc cùng kiểu chuỗi kí tự.Để thực hiện mã hóa dữ liệu vào một biến mới ta vào TransformÑ RecodeÑ Into DifferentVariables... và màn hình hiện ra hộp thoại:

P.T.Hồng-N.T.Nhung 23

Page 27: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 1. Xử lí dữ liệu trên SPSS

Chẳng hạn, ta định mã hóa lại các giá trị trong biến tuổi thành các khoảng tuổi

¤ 14 14� 24 24� 45 45� 60 ¡ 60

và đặt trong một biến mới là TuoiMoi ta thực hiện như sau:

• Chọn từ khung bên trái biến Tuoi để đưa vào khung Variable phía bên phải, trong khungOutput Variable đặt tên cho biến mới trong phần Name và gán nhãn cho biến mới(nếu cần) trong phần Label, chẳng hạn, Name: TuoiMoi, Label: chia Tuoi thanh cackhoang. Sau đó ấn change để khẳng định việc thay đổi:

• Nhấn phím Old and New Values để qui định cách mã hóa biến Tuoi và hộp thoại sau sẽhiện ra:

24 P.T.Hồng-N.T.Nhung

Page 28: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

1.5.Mã hóa dữ liệu

• Trong hộp thoại này để phân khoảng mã hóa ta ấn nút Range trong Old Value thiết lậpcác khoảng và thay thế bằng các giá trị mã hóa mới trong New Value rồi ấn nút Add đểchuyển cách mã hóa vào khung OldÑ New:, cụ thể như sau:

Khoảng tuổi Old Value New Value¤ 14 Range: Lowest through 14 1

14� 24 Range: 14 though 24 224� 45 Range: 24 though 45 345� 60 Range: 45 though 60 4¡ 60 Range: 60 though highest 5

Khi màn hình hiện ra hộp thoại sau ta ấn Continue

• Cuối cùng khi màn hình hiện ra hộp thoại sau thì ta ấn OK:

P.T.Hồng-N.T.Nhung 25

Page 29: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 1. Xử lí dữ liệu trên SPSS

• Ta có thể vào Variable View để khai báo lại một số thuộc tính của biến TuoiMoi cho phùhợp và ta được tập dữ liệu với biến tuổi đã được mã hóa:

1.6 Làm sạch dữ liệu

Trong quá trình nhập dữ liệu, trong nhiều trường hợp ta có thể nhập nhầm dữ liệu và nếu taxử lí dữ liệu trên file dữ liệu nhầm này sẽ dẫn đến kết quả phân tích bị sai lệch. Phương pháploại đi những dữ liệu sai này được gọi là phương pháp làm sạch dữ liệu. Trong phần này ta sẽgiới thiệu một số phương pháp làm sạch dữ liệu trên SPSS.

26 P.T.Hồng-N.T.Nhung

Page 30: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

1.6. Làm sạch dữ liệu

Dùng bảng tần số

Để tìm các lỗi dữ liệu bị nhầm, ta có thể lập bảng tần số để tìm ra những dữ liệu lạ để sửa.Chẳng hạn, trong file dữ liệu LamSachDuLieu.sav các biến GioiTinh và Nghe đều được mãhóa (Biến GioiTinh có hai giá trị là 0 và 1, biến Nghe có ba giá trị là 1,2,3,4), nếu ta lập bảngtần số cho biến GioiTinh thấy kết quả như sau:

thì ta biết ngay là các giá trị là 11 đã bị nhập nhầm. Để tìm ra các giá trị sai này để sửa ta có thểdùng lệnh Find để tìm, cụ thể như sau:

Bước 1: Trong cửa sổ Data View bôi đen cột GioiTinh và vào EditÑ Find..., màn hìnhhiện ra hộp thoại:

Bước 2: Điền dữ liệu sai cần tìm trong cột GioiTinh, ở đây là 11 trong dòng Find What và ấnFind Next. Khi đó những ô dữ liệu sai trong cột dữ liệu sẽ được hiện trắng, ta ấn Find Next lên

P.T.Hồng-N.T.Nhung 27

Page 31: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 1. Xử lí dữ liệu trên SPSS

tiếp để tìm và sửa những dữ liệu sai theo ý muốn.

Dùng lệnh Sort case để tìm dữ liệu sai trên cửa sổ Data View

Ta có thể sử dụng lệnh Sort Case trong Data để tìm những lỗi đơn giản ngay trên cửa sổ dữliệu (Data View), chẳng hạn với dữ liệu về giới tính, ta chỉ cần chọn lệnh sắp xếp dữ liệu theothứ tự tăng dần và nếu có những dữ liệu lớn hơn 1 thì đó chính là những dữ liệu lỗi. Cụ thể tatiến hành như sau:

Bước 1: Vào DataÑ Sort Cases..., màn hình hiện ra hộp thoại:

Bước 2: Chọn biến GioiTinh bên trái để đưa vào khung Sort by bên phải, trong khung SortOrder ta chọn Ascending và ấn OK.

Dùng bảng phối hợp hai biến hay ba biến

Khi lập bảng tần số kết hợp biến tuổi và biến nghề nghiệp:

28 P.T.Hồng-N.T.Nhung

Page 32: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

1.6. Làm sạch dữ liệu

bạn thấy có trường hợp nhân viên văn phòng (mã hóa 3) mà tuổi chỉ có 8 nên bạn nghĩ rằng mộttrong hai biến đã nhập sai. Trong trường hợp này ta phải tìm ra ô nhập sai và sửa lại. Để tìm raô nhập sai trong trường hợp này ta dùng lệnh Select Cases, cụ thể như sau:

Bước 1: Vào DataÑ Select Cases..., khi màn hình hiện ra hộp thoại thì ta chọn If Condi-tion is satisfied để nút If hiện ra và ấn vào.

Bước 2: Chọn biến Tuoi và biến NgheNghiep bên trái để đưa vào khung bên phải với điềukiện logic Tuoi=8 & NgheNghiep="2"

tiếp đó ấn Continue và ấn tiếp OK.Bước 3: Khi lệnh này được thực hiện, SPSS sẽ tạo ra một biến mới là filter $, biến này

nhận giá trị 0 tại tất cả các tình huống không thỏa mãn và 1 tại tình huống thỏa mãn điều kiệncủa lệnh If. Những giá trị là 1 trong biến filter $ chính là những trường hợp sai mà ta cần tìmđể sửa.

P.T.Hồng-N.T.Nhung 29

Page 33: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 2

Lập bảng tần số và tính các đạilượng thống kê mô tả

2.1 Tóm tắt dữ liệu bằng bảng tần số

Bảng tần số cho dữ liệu định tính và dữ liệu định lượng có ít biểu hiện

Để lập bảng tần số cho các biến định tính hoặc dữ liệu định lượng có ít biểu hiện trong tậpdữ liệu, Bước 1: Vào AnalyzeÑ Descriptive StatisticsÑ Frequencies.... Màn hình hiện rahộp thoại:

Bước 2: Chọn các biến cần lập bảng tần số bên trái đưa vào khungVariable bên phải và ấnOK.Ở đây, ta có thể tiến hành lập bảng tần số cho một biến hoặc một số biến cùng một lúc, chẳnghạn khi chọn biến GioiTinh và biến Gia trong cửa sổ Output nhận được kết quả sau:

30

Page 34: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

2.1. Tóm tắt dữ liệu bằng bảng tần số

Kết quả về bảng tần số cho ta những thông tin về tần số, tần suất của những giá trị trong biếnmà ta quan tâm. Chẳng hạn với biến GioiTinh và biến Gia ta có thể thấy số lượng cũng như tỉ lệnam và nữ trong mẫu cũng như số lượng và tỉ lệ của khoảng giá của một suất ăn FastFood điềutra trong mẫu.

Phân tổ dữ liệu

Khi tập dữ liệu định lượng có nhiều biểu hiện, việc tóm tắt bằng bảng tần số tương tự trênsẽ dài dẫn đến mất đi tính chất tóm lược thông tin. Trong trường hợp này ta sẽ tiến hành phântổ dữ liệu. Để phân tổ dữ liệu, ta thực hiện tương tự như phần mã hóa số liệu. Ta có thể chọnmã hóa thành đúng biến định lượng đã cho hoặc mã hóa thành biến mới, sau đó tính tần số chobiến đã được mã hóa.

Chẳng hạn để phân tổ cho biến tuổi thành các khoảng tuổi

¤ 14 14� 24 24� 45 45� 60 ¡ 60

đầu tiên ta mã hóa biến tuổi thành biến mới là PhanTuoi. Khi hộp thoại sau hiện ra ta chọnOutput variable are strings

P.T.Hồng-N.T.Nhung 31

Page 35: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 2. Lập bảng tần số và tính các đại lượng thống kê mô tả

và mã hóa tương ứng như sau:

Khoảng tuổi Old Value New Value¤ 14 Range: Lowest through 14 <= 14

14� 24 Range: 14 though 24 14 - 2424� 45 Range: 24 though 45 24 - 4545� 60 Range: 45 though 60 45 - 60¡ 60 Range: 60 though highest > 60

Sau đó, lập bảng tần số cho biến PhanTuoi và được kết quả sau:

2.2 Lập bảng tổng hợp nhiều biến

Bảng kết hợp hai biến định tính

Khi ta cần đưa ra tần số, tần suất của các biểu hiện của một biến định tính theo sự phân loạicủa một biến khác, ví dụ xét ngành nghề của những người được điều tra theo giới tính, ta có thểdùng lệnh Basic Tables (hoặc General Tables), cụ thể như sau:

32 P.T.Hồng-N.T.Nhung

Page 36: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

2.2. Lập bảng tổng hợp nhiều biến

Bước 1: Vào Analyze Ñ Tables Ñ Basic Tables.... Màn hình hiện ra hộp thoại BasicTables:

Bước 2: Chọn hai biến định tính bên trái đưa vào khung bên phải, cụ thể chọn biến NgheNghiepđưa vào ô Down và biến GioiTinh đưa vào ô Across. Ở đây, ta có thể tiến hành lập bảng tầnsố cho một biến hoặc một số biến cùng một lúc, chẳng hạn khi chọn biến GioiTinh và biến Giatrong cửa sổ Output nhận được kết quả sau:

Bước 3: Chọn những hàm thống kê cần tính bằng cách ấn Statistics

P.T.Hồng-N.T.Nhung 33

Page 37: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 2. Lập bảng tần số và tính các đại lượng thống kê mô tả

Đối với biến định tính, các hàm thường dùng là: count (tần số), col% (phần trăm theo cột),row% (phần trăm theo cột). Trong ví dụ này ta chọn count và row%, chọn xong ấn nút Addđể đưa vào ô bên phải và ấn Continue.

Bước 4: Trở lại hộp thoại trước, chọn Totals... nếu ta muốn tính tổng tần số trên dòng (cột)và cuối cùng ấn OK. Cửa sổ Output sẽ hiện ra kết quả sau:

Bảng kết hợp ba biến định tính

Khi ta cần biết một cách cụ thể hơn cơ cấu của giá mua FastFood của những người đượcđiều tra phân tách theo nhóm giới tính đối với từng nghề nghiệp thì ta phải lập bảng phối hợp babiến với nhau. Ta có thể dùng lệnh Basic Tables (hoặc General Tables). Cách tiến hành hoàntoàn tương tự như trường hợp lập bảng tần số cho hai biến định tính.

Bước 1: Mở hộp thoại Basic Tables.... Ta đưa hai biến NgheNghiep và GioiTinh vào ôAcross và đưa biến Gia vào ô Down

Bước 2: Khi đưa hai biến vào ô Across thì lúc này có hai biến ở vị trí cột nên phần dưới cùngcủa hộp thoại Basic Table sẽ nổi rõ lên để ta xác định hai cách phối hợp biến với nhau:

• All Combination (nested): hai biến trong cùng ô sẽ phân nhóm lồng ghép với nhau theothứ tự biến được đưa vào trong ôAcross. Trong trường hợp của ta các quan sát được phânchia theo ngành nghề, sau đó mỗi ngành nghề được phân chia theo từng giới tính nam vànữ.

• Each separately (stacked): hai biến được phân chia độc lập với nhau. Các quan sát đượcphân chia theo ngành nghề, sau đó các quan sát được phân chia theo giới tính riêng biệt.

Bước 3: Cách xác lập những hàm thống kê cũng tương tự như phần lập cho hai biến, nhưngtrong phần này ta chỉ nên chọn một trong hai hàm hoặc là count hoặc là Row% chứ không nên

34 P.T.Hồng-N.T.Nhung

Page 38: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

2.2. Lập bảng tổng hợp nhiều biến

chọn cùng một lúc cả hai vì qui mô của bảng khá lớn. Nếu chọn cùng một lúc cả hai thì sau đóphải ấn nút Layout... của hộp thoại Basic Tables để chọn cách trình bày là In separate tablesđể ta có thể lật từng lớp của bảng lên xem:

Bảng kết hợp một biến định tính và một biến định lượng

Khi ta cần những đại lượng thống kê mô tả của một biến định lượng theo sự phân loại củamột biến định tính, chẳng hạn ta muốn tính tuổi trung bình theo giới tính trong nhóm được điềutra, ta có thể dùng lệnh Basic Tables, cụ thể như sau:

Bước 1: Tại hộp thoại Basic Tables, ta đưa biến Tuoi vào ô Summaries, đưa biến GioiTinhvào ô Across

Bước 2: Chọn những đại lượng thống kê mô tả cần tính, chẳng hạn trung bình (Mean) và trungvịMedian Bước 3: Trong cửa sổ Output ta nhận được kết quả sau:

P.T.Hồng-N.T.Nhung 35

Page 39: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 2. Lập bảng tần số và tính các đại lượng thống kê mô tả

2.3 Tính các đại lượng thống kê mô tả

Trong một tập dữ liệu ta có thể tính các đại lượng thống kê mô tả của tập dữ liệu như

• Các đại lượng đo độ tập trung: trung bình cộng, trung vị, mode;

• Các đại lượng đo độ phân bố: tứ phân vị và phân vị thứ p;

• Các đại lượng đo độ phân tán: khoảng biến thiên, độ trải giữa, phương sai, độ lệch chuẩn;

• Các đại lượng mô tả hình dáng của tập dữ liệu: hệ số bất đối xứng Skewness, hệ số đo đọnhọn Kurtosis.

Trước hết ta nhắc lại định nghĩa và công thức tính toán những đại lượng này.

• Trung bình cộng đơn giản được tính bằng cách cộng tất cả các giá trị quan sát của tập dữliệu rồi chia cho số quan sát của tập dữ liệu đó;

• Trung vị là giá trị đứng giữa của tập dữ liệu đã được sắp thứ tự. Như vậy, không kể trungvị sẽ có 50% số quan sát của tập dữ liệu có giá trị lớn hơn trung vị và 50% số quan sát củatập dữ liệu có giá trị nhỏ hơn trung vị;

• Mode của một tập dữ liệu là giá trị xuất hiện nhiều nhất trong tập dữ liệu.

• Tứ phân vị chia tập dữ liệu đã sắp xếp theo trật tự tăng dần thành bốn phần có số quan sátbằng nhau. Tứ phân vị bao gồm ba tứ phân vị: tứ phân vị thứ nhất Q1, tứ phân vị thứ haiQ2 (chính là trung vị) và tứ phân vị thứ ba Q3. Trong tập dữ liệu có 25% số quan sát củatập dữ liệu nhỏ hơn hoặc bằngQ1, 50% số quan sát của tập dữ liệu nhỏ hơn hoặc bằngQ2

và có 75% số quan sát của tập dữ liệu nhỏ hơn hoặc bằng Q3.

• Phân vị thứ p của một tập dữ liệu đã được sắp thứ tự là giá trị chia tập dữ liệu thành haiphần, một phần gồm p% số quan sát có giá trị nhỏ hơn hoặc bằng phân vị thứ p, phần cònlại có (100� p)% số quan sát lớn hơn hoặc bằng phân vị thứ p.

• Khoảng biến thiên của một tập dữ liệu là hiệu giữa giá trị lớn nhất và giá trị nhỏ nhất củatập dữ liệu.

• Độ trải giữa của một tập dữ liệu là hiệu độ chênh lệch giữa tứ phân vị thứ ba và tứ phânvị thứ nhất của tập dữ liệu.

• Phương sai của một tập dữ liệu tổng thể, kí hiệu là σ2, được xác định bởi công thức:

σ2 =

°Ni=1(xi � µ)2

N, ở đây µ là trung bình của tổng thể và N là số quan sát trong tổng

thể.

• Phương sai của một tập dữ liệu mẫu, kí hiệu là s2, được xác định bởi công thức: s2 =°ni=1(xi � x)2

n� 1, ở đây x là trung bình của mẫu và n là số quan sát trong mẫu.

• Độ lệch chuẩn của một tập dữ liệu tổng thể, kí hiệu là σ, là căn bậc hai của phương saicủa tổng thể:

σ =

d°Ni=1(xi � µ)2

N.

36 P.T.Hồng-N.T.Nhung

Page 40: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

2.3. Tính các đại lượng thống kê mô tả

• Độ lệch chuẩn của một tập dữ liệu mẫu, kí hiệu là s, là căn bậc hai của phương sai mẫu:

s =

d°ni=1(xi � x)2

n� 1.

Chẳng hạn, để tính những đại lượng thống kê mô tả như: trung bình, trung vị, phương sai,độ lệch chuẩn của biến Tuoi:

Bước 1: Vào AnalyzeÑ Descriptive StatisticsÑ Descriptive... và khi màn hình sẽ hiệnra hộp thoại sau thì ta chọn biến Tuoi để đưa vào khung Variable(s) ở bên phải:

Bước 2: Ấn tiếp vào nútOptions để chọn tính những đại lượng thống kê mô tả cho biến tuổi vàmàn hình hiện ra hộp thoại:

Ta muốn tính đại lượng nào thì chọn vào đại lượng đó để hiện kết quả ra cửa sổ Output sau đóấn Continue và khi màn hình hiện ra hội thoại cũ thì ấn OK

Mean Trung bình cộngSum Tổng các giá trị của biếnStd.Deviation Độ lệch chuẩnMinimum Giá trị nhỏ nhấtMaximum Giá trị lớn nhấtVariance Phương saiRange Khoảng biến thiênSE mean độ lệch chuẩn của trung bình mẫuKurtosis Hệ số đo độ nhọnSkewness Hệ số bất đối xứng

P.T.Hồng-N.T.Nhung 37

Page 41: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 2. Lập bảng tần số và tính các đại lượng thống kê mô tả

Cửa sổ Output sẽ cho ta kết quả sau:

Tính tứ phân vị hay phân vị thứ p tùy ý của tập dữ liệu, chẳng hạn cho biến Tuoi:Bước 1: Vào Analyze Ñ Descriptive Statistics Ñ Frequencies... và màn hình hiện ra

hộp thoại:

Bước 2: Chọn các biến định lượng cần tính bên trái đưa vào khung Variable bên phải, ấnStatistics và nếu ta không muốn đưa bảng tần số thì không chọn ô Display frequency tables.Bước 3: Khi màn hình hiện ra hộp thoại:

ta chọn những đại lượng cần tính, ấn Continue trở về hộp thoại trước ấn OK.

38 P.T.Hồng-N.T.Nhung

Page 42: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

2.3. Tính các đại lượng thống kê mô tả

Median Trung vịMode ModeQuartiles Đưa tứ phân vịCut points for k equal groups Đưa ra các điểm chia tập dữ liệu thành k phần bằng nhauPercentiles k Đưa ra phân vị thứ k của tập dữ liệu

Chẳng hạn, ở hộp thoại trên ta tính trung vị, mode, tứ phân vị và phân vị thứ 10 với 90 của dữliệu Tuoi. Kết quả trong cửa số Output như sau:

Kết quả tính toán này trên SPSS cho ta thấy:

• Trung vị của tuổi là 21, mode của tuổi là 23;

• Ba tứ phân vị là: Q1 = 17.25, Q2 = 21, Q3 = 26.15;

• Phân vị thứ 10 là 15.10, phân vị thứ 90 là 45.90.

P.T.Hồng-N.T.Nhung 39

Page 43: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 2. Lập bảng tần số và tính các đại lượng thống kê mô tả

Bài tập ôn luyện

Mở tập dữ liệu DuLieuFastFood.sav vào trong cửa sổ Data Editor của SPSS và thực hiệncác yêu cầu sau:

1. Mã hóa lại biến GioiTinh và NgheNghiep với những giá trị mã hóa tương ứng như sau:Nam được mã hóa là 1, Nữ là 0; HSSV được mã hóa là 1, CNVC là 2, NVVP là 3,Khac là 4 và thay đổi khai báo lại về kiểu giá trị của hai biến này là dạng số, không cóchữ số thập phân nào sau dấu phảy. Lưu lại file dữ liệu sau khi đã mã hóa với tên làDuLieuFastFood MaHoaLai.sav.Các yêu cầu sau được thực hiện trên file DuLieuFastFood MaHoaLai.sav:

2. Mã hóa biến tuổi thành biến khác có tên là TuoiMoi với các mã hóa tương ứng như sau:Những người có tuổi không vượt quá 14 được mã hóa là 1, từ 14 đến 24 mã hóa là 2, từ24 đến 45 mã hóa là 3, từ 45 đến 60 mã hóa là 4 và trên 60 mã hóa là 5. Tính tỉ lệ nhữngngười có độ tuổi trên 60 trong nhóm được điều tra.

3. Đưa thông tin về những nữ nhân viên văn phòng trong mẫu.

4. Trong những người làm nhân viên văn phòng, hãy tính số người có thu nhập từ 3 đến 5triệu.

5. Trong số những người mua suất ăn FastFood với giá trên 40 nghìn, hãy tính tỉ lệ nhữngngười là học sinh và sinh viên.

6. Trong những nữ nhân viên văn phòng hãy tính tỉ lệ những người có thu nhập trên 5 triệumột tháng.

7. Tính tuổi trung bình của nam trong nhóm điều tra, tuổi trung bình của nữ trong nhóm điềutra và đưa ra nhận xét.

8. Một nửa số những người điều tra có độ tuổi không vượt quá bao nhiêu? Tính tuổi nhỏnhất trong nhóm 10% số người có tuổi cao nhất trong nhóm được điều tra.

9. 75% số nam được điều tra có tuổi không vượt quá bao nhiêu? 25% số nữ có độ tuổi ít nhấtlà bao nhiêu?

40 P.T.Hồng-N.T.Nhung

Page 44: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 3

Biểu đồ

3.1 Một số loại biểu đồ

• Biểu đồ thanh, biểu đồ tròn: áp dụng cho dữ liệu định tính

• Biểu đồ hộp và râu, biểu đồ tần số, biểu đồ tán xạ, biểu đồ gấp khúc,...: áp dụng cho dữliệu định lượng

3.2 Biểu đồ thanh

1. Biểu đồ thanh được dùng cho dữ liệu định danh hay thứ bậc

2. Chiều cao của mỗi thanh biểu diễn tần số hay tần suất của trường hợp biểu diễn bởi thanhđó

3. Có thể áp dụng để biểu diễn cho một hay nhiều tập dữ liệu trên cùng một biểu đồ

Cách vẽ biểu đồ thanh

Bước 1: Vào menu Graph ÝÑ Bar để mở cửa sổ Bar Chart

41

Page 45: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 3. Biểu đồ

Bước 2: Tại cửa sổ Bar Chart

1. Chọn Simple: nếu biểu diễn tập dữ liệu một biến

2. Chọn Clustered: nếu muốn biểu diễn tập dữ liệu của một biến được chia nhóm bởi mộtbiến khác, các thanh đứng kề nhau

3. Chọn Stacked: nếu muốn biểu diễn tập dữ liệu của một biến được chia nhóm bởi mộtbiến khác, các thanh chồng lên nhau

42 P.T.Hồng-N.T.Nhung

Page 46: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

3.2. Biểu đồ thanh

Ví dụ: vẽ biểu đồ thanh biểu diễn một biến

Để vẽ biểu đồ thanh biểu diễn biến nghề nghiệp (NgheNghiep) trong fileDuLieuThucHanh.savta tiến hành như sau

1. Tại hộp thoạiBar Chart, chọn Simple. Tại khu vựcData in Chart Area chọn Summaryfor group of cases. Ấn Define. Xuất hiện cửa sổ

2. Đưa biến NgheNghiep vào khung Category Axis

3. Lựa chọn N of cases để trục tung biểu diễn tần số, % of cases để trục tung biểu diễn tầnsuất

4. Ấn nút Title để đặt tiêu đề cho hình

5. Ấn OK.

Ví dụ: vẽ biểu đồ thanh biểu diễn một biến được phân tách bởi một biến khác

Để vẽ biểu đồ thanh biểu diễn biến nghề nghiệp (NgheNghiep) theo từng nhóm nam, nữ(biến nghề nghiệp được phân tách bởi biến giới tính) trong file DuLieuThucHanh.sav ta tiếnhành như sau:

P.T.Hồng-N.T.Nhung 43

Page 47: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 3. Biểu đồ

1. Tại hộp thoại Bar Chart, chọn Clustered. Tại khu vực Data in Chart Area chọn Sum-mary for group of cases. Ấn Define

2. Đưa biến NgheNghiep vào khung Category Axis, đưa biến GioiTinh vào khung DefineCluster by

3. Lựa chọn N of cases để trục tung biểu diễn tần số,% of cases để trục tung biểu diễn tầnsuất

4. Ấn nút Title để đặt tiêu đề cho hình

5. Ấn OK

44 P.T.Hồng-N.T.Nhung

Page 48: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

3.3. Biểu đồ tròn

3.3 Biểu đồ tròn

1. Biểu đồ tròn được dùng cho dữ liệu định danh hay thứ bậc

2. Mỗi hình quạt biểu diễn tỷ lệ đóng góp của từng biểu hiện trong tổng thể hay mẫu

Cách vẽ biểu đồ tròn

Bước 1: Vào menu Graph ÝÑ Pie để mở cửa sổ Pie Chart

Bước 2: Tại cửa sổ Pie Chart chọn Summary for group of cases. Ấn Define. Xuất hiện cửasổ sau

P.T.Hồng-N.T.Nhung 45

Page 49: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 3. Biểu đồ

Bước 3: Đưa biến cần biểu diễn vào khung Define Slice by. Ấn OK

3.4 Biểu đồ gấp khúc, diện tích (Line, Area Chart)

1. Biểu đồ gấp khúc, diện tích dùng để biểu diễn cho những tập dữ liệu định lượng.

2. Trên một biểu đồ có thể vẽ nhiều đường (vùng diện tích) cùng một lúc.

Hai loại biểu đồ này vẽ tương tự như biểu đồ thanh

Ví dụ

Dữ liệu về tuổi trong fileDuLieuThucHanh.sav có thể được biểu diễn bằng biểu đồ đườnggấp khúc như sau (chú ý là biến Tuoi đã được chia nhóm bằng biến ChiaNhomTuoi).

Bước 1: Vào menu Graph ÝÑ Line để mở cửa sổ Line Chart

46 P.T.Hồng-N.T.Nhung

Page 50: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

3.4. Biểu đồ gấp khúc, diện tích (Line, Area Chart)

Bước 2: Tại cửa sổ Line Chart chọn Simple, tại khu vực Data in Chart Area chọn Sum-mary for group of cases. Ấn Define

Bước 3: Đưa biến ChiaNhomTuoi vào khung Catgory Axis. Ấn OK

Ví dụ

Ta có thể vẽ bằng biểu đổ Area biểu diễn biến ChiaNhomTuoi theo giới tính như sauBước 1: Vào menu Graph ÝÑ Area để mở cửa sổ Area Chart

P.T.Hồng-N.T.Nhung 47

Page 51: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 3. Biểu đồ

Bước 2: Tại cửa sổ Area Chart chọn Simple, Summary for group of cases. Ấn Define

Bước 3: Đưa biến ChiaNhomTuoi vào khung Catgory Axis. Đưa biến GioiTinh vào khungDefine Area by. Ấn OK

3.5 Biểu đồ tần số (Histogram)

1. Biểu đồ tần số: dùng cho biến định lượng liên tục nhằm biểu diễn phân phối của tập dữliệu.

48 P.T.Hồng-N.T.Nhung

Page 52: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

3.5. Biểu đồ tần số (Histogram)

2. Chiều cao mỗi thanh hình chữ nhật trong biểu đồ biểu diễn tần số của lớp tương ứng.

Cách vẽ biểu đồ tần số (Histogram)

Bước 1: Chọn Graph ÝÑ Histogram

P.T.Hồng-N.T.Nhung 49

Page 53: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 3. Biểu đồ

Bước 2: Chọn một biến định lượng vào khung Variable

Bước 3: Nếu muốn hiển thị đường phân phối chuẩn thì chọn Display normal curve . Ấn OK.Ví dụ ta cần vẽ biểu đồ tần số cho biến tuổi trong file DuLieuThucHanh.sav. Trong bước

hai ta chọn biến định lượng là Tuoi. Hình vẽ như sau

50 P.T.Hồng-N.T.Nhung

Page 54: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

3.6. Biểu đồ hộp và râu (Boxplot)

3.6 Biểu đồ hộp và râu (Boxplot)

1. Biểu đồ hộp và râu: áp dụng cho dữ liệu định lượng

2. Biểu đồ hộp và râu gồm một hộp và hai râu

3. Đoạn thẳng trong hộp cho biết giá trị trung vị của tập dữ liệu, hai cạnh (song song với nó)còn lại cho biết giá trị tứ phân vị thứ nhất và thứ ba

4. Hai râu nối tới giá trị lớn nhất và nhỏ nhất

5. Biểu đồ phản ánh tính chất nghiêng và sự phân tán của tập dữ liệu

Cách vẽ biểu đồ hộp và râu (Boxplot)

Bước 1: Chọn Graph ÝÑ Boxplot...

P.T.Hồng-N.T.Nhung 51

Page 55: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 3. Biểu đồ

Bước 2: Tại cửa sổ Boxplot, chọn Simple nếu muốn biểu diễn hộp đơn, Cluster nếu biểu diễnhộp chùm.Tại khu vực Data in Chart Area, chọn Summary for group of cases nếu muốn biểu diễn biếnđịnh lượng theo các nhóm, Summary of seperate variables nếu muốn biểu diễn phân bố củanhiều biến khác nhau.

Nếu cần vẽ cho một biến định lượng ta có thể tiến hành như sauChọn Analyze ÝÑ Descriptive Statistics ÝÑ Explore

52 P.T.Hồng-N.T.Nhung

Page 56: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

3.6. Biểu đồ hộp và râu (Boxplot)

Bước 2: Tại cửa sổ Explore, chọn biến định lượng cần vẽ biểu đồ vào khung Dependent List.

Bước 3: Chọn một biến định lượng vào khung Variable. Ấn vào Plot mở ra cửa sổ sau.

Bước 4: Ấn Continue. Quay lại cửa sổ Explore, ấn OK.

P.T.Hồng-N.T.Nhung 53

Page 57: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 3. Biểu đồ

3.7 Biểu đồ tán xạ (Scatter plot)

Biểu đồ tán xạ dùng để biểu diễn mối quan hệ giữa hai biến định lượng.

Cách vẽ biểu đồ tán xạ (Scatter plot)

Bước 1: Chọn Graph ÝÑ Scatter/Dot. Được cửa sổ sau

Bước 2: Tại cửa sổ Scatter/Dot, chọn Simple nếu vẽ biểu đồ cho một cặp biến. (Ovelay biểudiễn nhiều đám mây đơn cùng biểu đồ,.... )

54 P.T.Hồng-N.T.Nhung

Page 58: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

3.7. Biểu đồ tán xạ (Scatter plot)

Bước 3: Chọn biến đưa vào khung Y-axis (giá trị là tung độ của điểm), biến đưa vào khungX-axis (giá trị là hoành độ của điểm)

P.T.Hồng-N.T.Nhung 55

Page 59: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 4

Kiểm định mối quan hệ giữa haibiến

Kiểm định Khi-bình phương về tính độc lập của hai biến định tính được dùng để kiểm địnhxem giữa hai biến định tính có mối quan hệ hay không, chẳng hạn giới tính có ảnh hưởng tớiviệc lựa chọn loại laptop? hay trình độ học vấn có mối liên hệ với cách đọc sách? Ta xét haitrường hợp như sau

• Một trong hai biến là biến định danh

• Cả hai biến là biến thứ bậc

Ví dụ: kiểm định mối liên hệ hai biến định danh, hay định danh-thứ bậc

Ta kiểm định xem giữa biến giới tính và sự lựa chọn giá sản phẩm thức ăn nhanh. Giả thuyếtđặt ra như sauH0 : Giới tính và giá sản phẩm lựa chọn không có mối quan hệH1 : Giới tính và giá sản phẩm lựa chọn có mối quan hệ

Sau đây là các bước tiến hành kiểm định mối liên hệ giữa hai biến

56

Page 60: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bước 1: Chọn Analyze ÝÑ Descriptive ÝÑ Crosstab để mở của sổ Crosstab

Bước 2: Tại cửa sổCrosstab, đưa biến thứ nhất vào khungRow(s), biến thứ hai vào khungColumn(s). Ấn Statistics..., xuất hiện cửa sổ

P.T.Hồng-N.T.Nhung 57

Page 61: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 4. Kiểm định mối quan hệ giữa hai biến

Bước 3: ChọnChi-square. ẤnContinue. Quay lại của sổCrosstab, chọnCell..., cửa sổCrosstab: Cell Display mở ra

Tại cửa sổ này, trong khungCount, chọnObserved nếumuốn hiển thị tần số quan sát trong bảngchéo, chọn Expected nếu nếu muốn hiển thị tần số lý thuyết trong bảng chéo. Ấn Continue.Quay lại của sổ Crosstab. OK

Kết quả cho ba bảng như sau

58 P.T.Hồng-N.T.Nhung

Page 62: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Kiểm định là tiến hành kiểm tra xem những dữ liệu thu được trên mẫu có đủ mạnh để ủng hộmột giả thuyết hay không. Kết luận cuối cùng sẽ là chấp nhận H0 tức bác bỏ H1 hoặc bác bỏH0 tức chấp nhận H1. Chúng ta so sánh mức ý nghĩa của bài toán α (thường là 0.01, 0.05 hay0.1) và p-giá trị (Sig.) theo quy tắc

• Nếu α ¡ p-giá trị thì bác bỏ H0

• Nếu α ¤ p-giá trị thì chấp nhận H0

Trong bảng Chi-Square Tests, trên dòng Pearson Chi-Square ta thấy p-giá trị = 0.582. Nếusử dụng mức ý nghĩa α = 0.05 thì ta có α   0.582, ta chấp nhận giả thuyết H0 rằng không cómối liên hệ giữa giới tính và lựa chọn giá của sản phẩm thức ăn nhanh. Kiểm định có ý nghĩakhi có không quá 20% số tần số kỳ vọng nhỏ hơn 5. Dòng chữ nhỏ phía cuối bảng cho biết sốtần số kỳ vọng dưới 5 chỉ có 1 ô chiếm 12.5%.

Kiểm định mối liên hệ hai biến thứ bậc

Trong trường hợp hai biến thứ bậc ta có thể đo độ mạnh mối liên hệ tuyến tính của hai biếnđó.

Trong bước 3, tại cửa sổ Crosstab: Statistics, tại khung Ordinal ta chọn một số chỉ số :Gamma, Somers'd, Kendall's tau b. Ấn OK. Quay về hộp thoại trước, ấn OK

P.T.Hồng-N.T.Nhung 59

Page 63: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 4. Kiểm định mối quan hệ giữa hai biến

60 P.T.Hồng-N.T.Nhung

Page 64: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 5

Kiểm định về trung bình

5.1 Kiểm định về trung bình một tổng thể

Có thể cho rằng độ tuổi trung bình của khách hàng sử dụng sản phẩm thức ăn nhanh (kýhiệu là µ) là 20 hay không. Cặp giả thuyết đặt ra như sau

H0 : µ = 20, H1 : µ � 20

Ta sẽ sử dụng biến Tuoi trong file DuLieuThucHanh.sav để kiểm định các giả thuyết này.Bước 1: Vào Analyze ÝÑ Compare Means ÝÑOne-Sample T Test... để mở cửa sổ

One-Sample T Test

Bước 2: Tại cửa sổ One-Sample T Test, đưa biến định lượng cần phân tích (Tuoi) vàokhung Test Variable(s). Khai báo giá trị cần so sánh của trung bình tổng thể vào ô Test Value.

61

Page 65: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 5. Kiểm định về trung bình

ẤnOptions để chọn độ tin cậy cho khoảng ước lượng. Ấn Continue trở về hộp thoại trước, rồiấn OK

Kết quả cho trong hai bảng sau

Theo kết quả, giá trị trung bình của mẫu là 25.13 tuổi, giá trị của kiểm định t là 3.922, và p-giátrị là 0.000 rất nhỏ. Vậy ta bác bỏ giả thuyết H0 và căn cứ vào chênh lệch dương giữa trungbình mẫu và giá trị Test Value=20, ta cho rằng độ tuổi trung bình của các khách hàng trên 20.Hai con số cuối cho biết ước lượng khoảng với độ tin cậy 95% cho độ tuổi trung bình của kháchhàng là (22.53, 27.73). Qua đó có thể thấy khách hàng tập trung trong độ tuổi trẻ.

5.2 Kiểm định về sự khác nhau của hai trung bình của hai tổng thể khi mẫu độc lập

Sử dụng tập dữ liệu SoSanh2Mang.sav để so sánh sự hài lòng của khách hàng trong mẫugồm 97 người về chất lượng dich vụ của hai mạng di động khác nhau. Thang điểm đánh giátăng từ 1 tới 7 theo sự tăng của mức hài lòng.

62 P.T.Hồng-N.T.Nhung

Page 66: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

5.2. Kiểm định về sự khác nhau của hai trung bình của hai tổng thể khi mẫu độc lập

Gọi µ1, µ2 là điểm đánh giá trung bình của hai nhóm khách hàng của mạng di động thứnhất, thứ hai. Giả thuyết

H0 : µ1 = µ2 H1 : µ1 � µ2

Dữ liệu gồm một biến định lượng (Diem) và một biến định tính phân loại (MangDD).Bước 1: Vào Analyze ÝÑ Compare Means ÝÑIndependent-Sample T Test...

Bước 2: Tại cửa sổ Independent-Sample T Test, đưa biến Diem vào khung Test Value,biến MangDD vào khung Grouping Variable. Ấn Define Groups...

P.T.Hồng-N.T.Nhung 63

Page 67: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 5. Kiểm định về trung bình

Bước 3: Nhập mã của nhóm 1 và nhóm 2 vào của sổ Define Groups. Ấn Continue. Trở vềhộp thoại trước ấn OK.

Kết quả kiểm định F cho thấy hai phương sai tổng thể bằng nhau nên sử dụng kiểm định t ứngvới dòng Equal Variance Assumed. P-giá trị =0.000 nên ta bác bỏ H0. Chênh lệch trên mẫu củanhóm Vie nhỏ hơn so với nhóm Mob nên có thể cho rằng sự hài lòng của khách hàng với dịchvụ di dộng của mạng Mob cao hơn so với mạng Vie.

5.3 Kiểm định về sự khác nhau của hai trung bình của hai tổng thể khi mẫu cặp

Khi cần so sánh trung bình hai tổng thể trong trường hợp lấy mẫu từng đôi (khi hai tổng thểcó liên hệ với nhau). Dữ liệu là hai biến định lượng nhận giá trị trong từng cặp dữ liệu.

Trong ví dụ sau đây ta điều tra sự hài lòng của khách hàng thông qua việc so sánh điểm kỳvọng trước khi sử dụng dịch vụ và điểm đánh giá sau khi trải nghiệm dịch vụ (về chất lượngcuộc gọi trong dịp lễ Tết). Nếu gọi Gọi µ1, µ2 là điểm đánh giá trung bình trước và sau khi dùngdịch vụ. Ta kiểm định cặp giả thuyết:

H0 : µ1 = µ2 H1 : µ1 � µ2

Bước 1: Vào Analyze ÝÑ Compare Means ÝÑPaired-Sample T Test...

64 P.T.Hồng-N.T.Nhung

Page 68: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

5.3. Kiểm định về sự khác nhau của hai trung bình của hai tổng thể khi mẫu cặp

Bước 2: Tại cửa sổ Paired-Sample T Test, dùng phím Ctrl để chọn hai biến TruocSuDung,SauSuDung đưa vào khung Paired Variable

Bước 3: Ấn OK

P.T.Hồng-N.T.Nhung 65

Page 69: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 5. Kiểm định về trung bình

p-giá trị = 0.002 nhỏ hơn mức ý nghĩa 0.05 nên bác bỏ giả thuyết H0 cho rằng điểm đánhgiá kỳ vọng trước sử dụng và điểm đánh giá sau sử dụng bằng nhau. Ngoài ra giá trị kiểm địnht dương nên ta có thể cho rằng khách hàng chất lượng cuộc gọi của các mạng di động chưa đápứng được sự mong đợi của khách hàng.

66 P.T.Hồng-N.T.Nhung

Page 70: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 6

Phân tích phương sai (ANOVA)

Phương pháp phân tích phương sai được dùng khi nghiên cứu ảnh hưởng của biến nguyênnhân định tính lên biến kết quả định lượng, phương pháp này so sánh trung bình của nhiều nhóm(3 nhóm trở lên).Giả thuyết H0 như sau:

H0 : µ1 = µ2 = � � � = µk

có nghĩa là:

H0 : biến định tính không có ảnh hưởng tới biến định lượng

Giả thuyết đối

H1 : biến định tính có ảnh hưởng tới biến định lượng

Dữ liệu đầu vào: gồm một biến định lượng và một biến phân loại. Các bước tiến hành như sau

Ví dụ

Giả sử ta cần so sánhmức hài lòng của khách hàng sử dụng dịch vụ của bamạng di động Vie,Mob, Vin về chất lượng dịch vụ. Dữ liệu thu thập được lưu trong file SoSanh3Mang.sav. Cácbước tiến hành như sau: Bước 1: VàoAnalyzeÝÑCompareMeansÝÑOne-Way ANOVA...để mở cửa sổ One-Way ANOVA

67

Page 71: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 6. Phân tích phương sai (ANOVA)

Bước 2: Tại cửa sổ One-Way ANOVA, đưa biến định lượng vào khung Dependent List, biếnphân loại vào khung Factor. Ấn Options mở ra hộp thoại sau

Bước 3: ChọnDescriptive để tính các đại lượng thống kêmô tả cho từng nhóm; chọnHomogeneity-of-variance để tiến hành thủ tục kiểm định sự bằng nhau của các phương sai tổng thể. Sau đóấn Continue trở về hộp thoại trước ấn OK. Kết quả cho trong 3 bảng sau

68 P.T.Hồng-N.T.Nhung

Page 72: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bảng đầu tiên đưa ra kết quả tính một số đại lượng thống kê mô tả cho từng nhóm.Bảng thứ hai là kết quả của thủ tục kiểm định sự bằng nhau của các phương sai. Với giá trị Sig.là 0.388 ta chấp nhận giả thuyết rằng các phương sai bằng nhau.

Bảng thứ ba, cho biết p-giá trị Sig=0.002 nên ta bác bỏ giả thuyếtH0 với mức ý nghĩa 0.05.Như vậy có thể cho rằng sự hài lòng của khách hàng đối với 3 mạng di động có khác biệt.

Phân tích kỹ hơn sự khác biệt này có thể tiến hành trong mục sau

Phân tích sâu ANOVA

Các bước trong phân tích sâu ANOVA được thực hiện tương tự như phân tích phương saiANOVA nhưng trong bước 2 ta làm thêm thao tác sau: Tại cửa sổ One-Way ANOVA, ấn PostHoc, mở cửa sổ sau

Bảng trên liệt kê một số phương pháp so sánh các cặp trung bình khác nhau. Trong ví dụ này tachọn phương pháp Tukey nên chọnTukey.

P.T.Hồng-N.T.Nhung 69

Page 73: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Bài 6. Phân tích phương sai (ANOVA)

Kết quả so sánh từng cặp dựa trên cột Sig. ta thấy sự hài lòng của khách hàng đối với hai mạngMob và Vin như nhau nhưng đều tốt hơn so với mạng di động còn lại.

70 P.T.Hồng-N.T.Nhung

Page 74: Bàigiảng hướngdẫn thựchành SPSSdulieu.tailieuhoctap.vn/books/giao-duc-dai-cuong/kinh-te-hoc/file... · Bài1 XửlídữliệutrênSPSS 1.1 GiớithiệuvàcàiđặtphầnmềmSPSS

Tài liệu tham khảo

[1] Hoàng Trọng, Chu Nguyễn Mộng Ngọc, Phân Tích Dữ Liệu Nghiên Cứu với SPSS, Tập1, 2, Nhà xuất bản Hồng Đức, năm 2008.

[2] Hồ Đăng Phúc, Sử Dụng Phần Mềm SPSS Trong Phân Tích Số Liệu, Nhà xuất bản Khoahọc và Kĩ thuật.