73
SPSS TH T LÀ Đ N GI N Ơ Hoàng Sĩ Thính Department of Finance Faculty of Accounting and Business Management Vietnam National University of Agriculture Mobile: +84942293689 Email: [email protected] Facebook: [email protected]

Spss lesson #1 #4.1 (Vietnamese)

Embed Size (px)

DESCRIPTION

SPSS code book, preparing data file, entering data, screening and cleaning data, descriptives statistics

Citation preview

Page 1: Spss lesson #1 #4.1 (Vietnamese)

SPSS TH T LÀ Đ N GI NẬ Ơ Ả

Hoàng Sĩ Thính

Department of Finance

Faculty of Accounting and Business Management

Vietnam National University of Agriculture

Mobile: +84942293689

Email: [email protected]

Facebook: [email protected]

Page 2: Spss lesson #1 #4.1 (Vietnamese)

N I DUNGỘ

• Ph n 1: B t tay v i SPSSầ ắ ớ1. Thi t k m t nghiên c uế ế ộ ứ2. Chu n b mã bi n (codebook)ẩ ị ế3. Giao di n SPSSệ

• Ph n 2: Chu n b file d li uầ ẩ ị ữ ệ4. T o file s li u và nh p d li uạ ố ệ ậ ữ ệ5. Ki m tra và “ể làm s chạ ” d li uữ ệ

• Ph n 3: Nh ng phân tích s li u căn b nầ ữ ố ệ ả6. Phân tích th ng kê mô tố ả7. Phân tích s li u b ng đ thố ệ ằ ồ ị8. Qu n lý, bi n đ i d li uả ế ổ ữ ệ9. Ki m tra đ tin c y c a thang đoể ộ ậ ủ10. L a ch n và s d ng các k thu t thông kêự ọ ử ụ ỹ ậ

Page 3: Spss lesson #1 #4.1 (Vietnamese)

N I DUNGỘ

• Ph n 4: Công c th ng kê phân tích m i quan h gi a các bi nầ ụ ố ố ệ ữ ế11. T ng quanươ12. T ng quan t ng ph nươ ừ ầ13. H i quy đa bi nồ ế14. H i quy logisticsồ15. Phân tích nhân t (Factor analysis)ố

• Ph n 5: K thu t so sánh các nhómầ ỹ ậ16. K thu t phân tích phi tham sỹ ậ ố17. Ki m đ nh sai khác s trung bình c a các nhóm (T-test)ể ị ố ủ18. Ki m đ nh khác bi t gi a hai ho c nhi u nhóm (F-test; ho c one-way ể ị ệ ữ ặ ề ặ

analysis of variance – ho c One-way ANOVA)ặ19. Ki m đ nh Two-way analysis of varianceể ị20. Ki m đ nh Mixed between-within subjects aualysis of variance (s chi ti t ể ị ẽ ế

sau)21. Multivariate analysis of variance22. Analysis of covariance

Page 4: Spss lesson #1 #4.1 (Vietnamese)

1. Thi t k m t nghiên c uế ế ộ ứ• Thi t k nghiên c u theo ki u nào (th c nghi m, đi u tra, quan sát) ế ế ứ ể ự ệ ề

nh m tr l i câu h i nghiên c uằ ả ờ ỏ ứ• N u là nghiên c u th c nghi m: chú ý s khác bi t gi a các nhóm: các ế ứ ự ệ ự ệ ữ

nhóm khác nhau cùng đi u ki n, ho c cùng m t nhóm nh ng khác đi u ề ệ ặ ộ ư ềki nệ

• Trong nghiên c u th c nghi m, chú ý c n có đ bi n đ c l p đ k t lu n ứ ự ệ ầ ủ ế ộ ậ ể ế ậđ a ra đ c th a đáng.ư ượ ỏ

• C g ng bao g m trong k ho ch nhi u h n nh ng gì nghiên c u c n ố ắ ồ ế ạ ề ơ ữ ứ ầ(n i dung, đ i t ng): tránh r i roộ ố ượ ủ

• Trong nghiên c u th c nghi m, các n i dung, ph m vi đ i t ng c n th a ứ ự ệ ộ ạ ố ượ ầ ỏđáng (đ ), các nhóm nên đ c đ t trong các đi u ki n t ng đ ng.ủ ượ ặ ề ệ ươ ồ

• Ch n bi n ph thu c phù h p (“ọ ế ụ ộ ợ có ý nghĩa lý lu nậ ”)• Tránh s d ng các bi n không rõ ràng. Hãy tham v n chuyên gia v v n ử ụ ế ấ ề ấ

đ nàyề• Nh ph i đi u tra th (n u có phi u đi u tra)ớ ả ề ử ế ế ề• N u nghiên c u th c nghi m, hãy ch c ch n m i đi u ki n đ c chu n ế ứ ự ệ ắ ắ ọ ề ệ ượ ẩ

b k càngị ỹ

Page 5: Spss lesson #1 #4.1 (Vietnamese)

Các chú ý khi l a ch n thang đo (scales) và đ n v đo (measures) ự ọ ơ ị

– Đáng tin c y (reliability): t c là không b nh h ng b i các sai s ng u ậ ứ ị ả ưở ở ố ẫnhiên. • Các l n th (đi u tra l p l i) khác nhau cho cùng đ i t ng ph i ầ ử ề ặ ạ ố ượ ả

không khác nhau (tin c y theo th i gian, ho c test-retest reliability, ậ ờ ặho c temporal stability);ặ

• Và ch c ch n theo n i dung c n đo đ c (internal consistency): ví d ắ ắ ộ ầ ạ ụk t qu tr l i “ế ả ả ờ b n có thích s d ng xe đ p không?ạ ử ụ ạ ” và “b n có ạghét xe đ p không?ạ ”

– Tính chính xác (validity): thang đo có đo đúng n i dung mà ng i nghiên ộ ườc u c n không? Bao g m: ứ ầ ồ• chính xác v n i dung (content validity, ho c chính xác v m t lôgic ề ộ ặ ề ặ

– logical validity); • tính h p lý (chính xác) trong m c đ thang đo c a các bi n khác ợ ứ ộ ủ ế

nhau (criterion validity), ví d : IQ cao h n thì th ng đi m s cao ụ ơ ườ ể ốh n; ơ

• tính chính xác v nguyên lý (construct validity)ề

Page 6: Spss lesson #1 #4.1 (Vietnamese)

Các d ng đo l ng c a thang đo (measurement scale, ạ ườ ủho c ki u s li u – types of data)ặ ể ố ệ

• Có 4 ki u s li u (ki u đo l ng c a m t thang đo): ể ố ệ ể ườ ủ ộnominal (ki u đ nh danh), ordinal (ki u m c đ theo th ể ị ể ứ ộ ứt ), interval (d ng s ) , và ratio (d ng s hoàn h o)ự ạ ố ạ ố ả

• D ng thang đo đ nh danh (nominal scale): là d ng thang đo ạ ị ạ“th pấ ” nh t.ấ– ch là con s (hay nhãn) gán cho m t l a ch n nào đó. Ch ng ỉ ố ộ ự ọ ẳ

qua ch đ phân lo i (categorize) câu tr l i, không có ý nghĩa ỉ ể ạ ả ờv th t hay c u trúcề ứ ự ấ

– Ví d : Yes, No; 1 = Brown, 2 = Black, 3 = Blond, 4 = Gray, 5 = ụOther.

– X lý trong th ng kê: th ng kê phi tham s (non-parametric ử ố ố ốgroup), th ng g p nh t là mode (xu t hi n nhi u nh t), ườ ặ ấ ấ ệ ề ấCrosstabulation with chis-quare. Ngoài ra s li u d ng nominal ố ệ ạcũng đ c dùng trong các mô hình ph c t p. ượ ứ ạ

Page 7: Spss lesson #1 #4.1 (Vietnamese)

Các d ng đo l ng c a thang đo (measurement scale, ạ ườ ủho c ki u s li u – types of data)ặ ể ố ệ

• D ng s li u th t (ordinal): Ph bi n cho d ng câu h i yêu c u ạ ố ệ ứ ự ổ ế ạ ỏ ầs p x p th h ng (ranking) ho c cho đi mắ ế ứ ạ ặ ể– Ví d :ụ

– D ng s li u th t cho bi t m c đ (l n, bé), tuy nhiên không ạ ố ệ ứ ự ế ứ ộ ớcho bi t chính xác kho ng cách th c gi a các giá tr (ví d ế ả ự ữ ị ụkho ng cách t r t không h nh phúc đ n không h nh phúc)ả ừ ấ ạ ế ạ

– K thu t th ng kê có th s d ng: th ng kê phi tham s (non-ỹ ậ ố ể ử ụ ố ốparamatric statistics):• Median and Mode; t ng quan th t (rank order correlation); phân ươ ứ ự

tích ph ng sai phi tham s (non-paramatric analysis of variance)ươ ố• M t s k thu t mô hình cũng có th áp d ng v i s li u theo t tộ ố ỹ ậ ể ụ ớ ố ệ ứ ự

Page 8: Spss lesson #1 #4.1 (Vietnamese)

Các d ng đo l ng c a thang đo ạ ườ ủ(measurement scale, ho c ki u s li u – types of data) (ti p)ặ ể ố ệ ế

• Thang đo theo kho ng (interval scale – ki u s li u theo kho ng): ả ể ố ệ ảgi a các giá tr c a thang đo có m t kho ng cách (khác bi t) đ c ữ ị ủ ộ ả ệ ượnh n th c m t cách rõ r t. Khác v i s li u d ng th t (ch bi t ậ ứ ộ ệ ớ ố ệ ạ ứ ự ỉ ếkhác bi t v th t , ch không bi t kho ng cách gi a các th t ệ ề ứ ự ứ ế ả ữ ứ ựm t cách chính xác)ộ– Ví d : Câu h i yêu c u ng i tr l i đánh giá m c đ hài lòng d a ụ ỏ ầ ườ ả ờ ứ ộ ự

trên thang đo có 7 m c (t không hài lòng = 7 đ n r t hài lòng = 7).ứ ừ ế ấ– K thu t th ng kê áp d ng: ỹ ậ ố ụ

• Th ng kê tham s (parametric statistics): s trung bình (mean) và đ l ch ố ố ố ộ ệchu n (standard deviation); t ng quan r (correlation r); h i quy ẩ ươ ồ(regression);phân tích ph ng sai; phân tích nhân t (factor analysis)ươ ố

• Và t t c các k thu t th ng kê đa bi n và mô hình hóa chuyên sâuấ ả ỹ ậ ố ế

Page 9: Spss lesson #1 #4.1 (Vietnamese)

Các d ng đo l ng c a thang đo ạ ườ ủ(measurement scale, ho c ki u s li u – types of data) (ti p)ặ ể ố ệ ế

• Thang đo d ng s (t s - ratio – ki u s li u ạ ố ỷ ố ể ố ệs , ho c t s ): Là d ng s li u “ố ặ ỷ ố ạ ố ệ cao c p ấnh tấ ” trong th ng kê.ố– S khác bi t gi a s li u d ng kho ng (interval) ự ệ ữ ố ệ ạ ả

và d ng s (ratio): d ng interval không có m t s ạ ố ạ ộ ố0 tuy t th c s (ch ng h n nhi t đ ), trong khi ệ ự ự ẳ ạ ệ ộd ng ratio có s 0 th c s (ví d đo đ dài)ạ ố ự ự ụ ộ

– K thu t th ng kê: t ng t s li u d ng intervalỹ ậ ố ươ ự ố ệ ạ

Page 10: Spss lesson #1 #4.1 (Vietnamese)

Các chú ý khi phát tri n b ng câu h i (phi u đi u tra)ể ả ỏ ế ề

• Mình d đ nh s s d ng thông tin thu th p đ c nh th nào?ự ị ẽ ử ụ ậ ượ ư ế

• K thu t th ng kê nào s đ c s d ng đ x lý s li u (thông tin) s thu ỹ ậ ố ẽ ượ ử ụ ể ử ố ệ ẽth p?ậ

• Các lo i câu h i trong phi u đi u tra: câu h i đóng và câu h i mạ ỏ ế ề ỏ ỏ ở– Câu h i đóng: ng i tr l i đ c đ ngh l a ch n m t (ho c các) trong ỏ ườ ả ờ ượ ề ị ự ọ ộ ặ

nh ng l a ch n đ c ch đ nh s n. Ví d : “ữ ự ọ ượ ỉ ị ẵ ụ gi i tính c a b n là gì?ớ ủ ạ ” – nam/

n / trung tính, ho c ữ ặ “b n có đang là sinh viên ph i không?ạ ả ” – ph i/ không ảph i, …ả

– Câu h i m : ng i tr l i đ c t do đ a ra quan đi m c a mình (có th ỏ ở ườ ả ờ ượ ự ư ể ủ ểkhông gi ng v i nh ng l a ch n đã đ c li t kê s n trong câu h i), ví d : ố ớ ữ ự ọ ượ ệ ẵ ỏ ụ“nguyên nhân chính nào d n đ n áp l c trong cu c s ng c a b n th i đi m ẫ ế ự ộ ố ủ ạ ở ờ ểhi n t i?ệ ạ ”

Page 11: Spss lesson #1 #4.1 (Vietnamese)

• Thi t k d ng th c cho câu tr l i (response format) nh th nào?ế ế ạ ứ ả ờ ư ế– Thông tin thu th p s đ c x lý b ng k thu t th ng kê nào? Ví d : ậ ẽ ượ ử ằ ỹ ậ ố ụ

n u phân tích t ng quan (correlation) thì thông tin thu th p ph i là ế ươ ậ ảd ng s liên t c ạ ố ụ

– C g ng tránh h i r ng “ố ắ ỏ ằ b n có đ ng ý?ạ ồ ” hay “không đ ng ý?ồ ” mà hãy dùng thang đo Likert cho l a ch n t ự ọ ừ “r t không đ ng ýấ ồ ” (l y giá ấtr 1) đ n ị ế “r t đ ng ýấ ồ ” (l y giá tr 10).ấ ị

– Khi s d ng b t kỳ d ng th c g i ý tr l i nào, b n c n ph i gi i thích ử ụ ấ ạ ứ ợ ả ờ ạ ầ ả ảcho nó m t cách rõ ràng. Ví d : b n mu n ng i tr l i tích vào m t ô ộ ụ ạ ố ườ ả ờ ộvuông, hay khoanh tròn m t s , hay đánh m t d u trên m t hàng nào ộ ố ộ ấ ộđó.

– Không bao gi đ c nghĩ r ng “ờ ượ ằ ng i tr l i s hi u taườ ả ờ ẽ ể ”. N u có th , ế ểkèm theo h ng d n, hãy đ a ra ví d v m t câu tr l i cho câu h i ướ ẫ ư ụ ề ộ ả ờ ỏc a mình.ủ

– Lo i b t t c nh ng n i dung, t ng có th gây ra nh m l n, khó ạ ỏ ấ ả ữ ộ ừ ữ ể ầ ẫhi u. D li u đ c càng nhi u càng t t các câu tr l i có th c a ể ự ệ ượ ề ố ả ờ ể ủng i đ c h i.ườ ượ ỏ

Các chú ý khi phát tri n b ng câu h i (phi u đi u tra) (ti p)ể ả ỏ ế ề ế

Page 12: Spss lesson #1 #4.1 (Vietnamese)

Các chú ý khi phát tri n b ng câu h i (phi u đi u tra) (ti p)ể ả ỏ ế ề ế

• S d ng t ng trong thi t k câu h i đi u tra th ử ụ ừ ữ ế ế ỏ ề ếnào? Chú ý tránh:– Câu h i dài và ph c t p;ỏ ứ ạ– Ph đ nh c a ph đ nh (hãy dùng kh ng đ nh thay cho nó);ủ ị ủ ủ ị ẳ ị– Ôm đ m nhi u n i dung.ồ ề ộ– T lóng ho c vi t t từ ặ ế ắ– Ti ng ho c ng nghĩa đ a ph ngế ặ ữ ị ươ– T đa nghĩaừ– Câu h i g i ý câu tr l iỏ ợ ả ờ– Nh ng câu h i ch ý gây nh h ng đ n tâm lý ng i tr ữ ỏ ủ ả ưở ế ườ ả

l iờ

Page 13: Spss lesson #1 #4.1 (Vietnamese)

2. Mã hóa d li u (Codebook)ữ ệ• Bao g m 2 vi c chính:ồ ệ

– Đ nh nghĩa và g n nhãn cho m i bi n. Ví d : tu i có th đ c ị ắ ỗ ế ụ ổ ể ượgán mã là “age”

– G n s cho m i câu tr l i. Ví d : “ắ ố ỗ ả ờ ụ có” nh n s 1, ậ ố “không” nh n ậs 2ố

• Tên bi n: m i m t câu h i trong phi u đi u tra c n có m t ế ỗ ộ ỏ ế ề ầ ộtên bi n riêng bi t. Lu t đ t tên bi n nh sau:ế ệ ậ ặ ế ư– Tên bi n nên duy nh t (không gi ng v i bi n khác)ế ấ ố ớ ế– Nên b t đ u b ng m t ch cáiắ ầ ằ ộ ữ– Không bao g m các d u ch m (.), d u cách, ho c các bi u ồ ấ ấ ấ ặ ể

t ngượ– Không đ c phép bao g m các t l nh c a SPSS (all, ne, eq, to, ượ ồ ừ ệ ủ

le, it, by, or, gt, and, not, ge, with)– Không đ c phép v t quá 64 ký t (t t nh t là d i 8 ký t )ượ ượ ự ố ấ ướ ự

Page 14: Spss lesson #1 #4.1 (Vietnamese)

2. Mã hóa d li u (Codebook) (ti p)ữ ệ ế

• Mã hóa câu tr l i:ả ờ– M i câu tr l i c n đ c mã hóa cho m t s (n u nó ỗ ả ờ ầ ượ ộ ố ế

ch a ph i là d ng s ) tr c khi đ c nh p vào SPSS. ư ả ạ ố ướ ượ ậVí d : 1=“ụ nam”, 2=“nữ”.

– Trong các câu h i đóng có li t kê các ý tr l i, nên đ t ỏ ệ ả ờ ặs theo đúng th t li t kê (sau này d nh p li u).ố ứ ự ệ ễ ậ ệ

• Đ i v i câu h i m :ố ớ ỏ ở– Li t kê các tr l i th ng l p l i trong các câu tr l iệ ả ờ ườ ặ ạ ả ờ– M i câu tr l i th ng g p đó s đ c mã hóa cho ỗ ả ờ ườ ặ ẽ ượ

m t s .ộ ố– V i các câu tr l i khác, gán cho nó m t mã hoàn ớ ả ờ ộ

toàn khác (ví d mã 99)ụ

Page 15: Spss lesson #1 #4.1 (Vietnamese)

Ví d v mã hóa d li uụ ề ữ ệTên bi n trong phi u ế ế

đi u traềTên bi n s ế ửd ng trong ụ

SPSS

Ghi chú v mã hóaề

Identification Number ID Number assigned to each survey

Sex Sex 1 = Male2 = Female

Age Age Age in years

Marital Status Marital 1 = single2 = steady relationship3 = married for the first time4 = remarried5 = separated/divorced6 = widowed

Optimism scale items 1 to 6

Opt1 to Opt6 Enter number circled from 1 (strongly disagree) to 5 (strongly agree)

Page 16: Spss lesson #1 #4.1 (Vietnamese)

Ví d v mã hóa d li u (ti p)ụ ề ữ ệ ếĐ i v i câu h i mố ớ ỏ ở

• Câu h i: “ỏ Đâu là nguyên nhân chính gây ra áp l c trong cu c s ng c a b n hi n nay?ự ộ ố ủ ạ ệ ”

• Các câu tr l i có th s r t nhi u (tùy theo ả ờ ể ẽ ấ ềc m nh n c a t ng ng i đ c h i)ả ậ ủ ừ ườ ượ ỏ

• B n hãy nhóm các câu tr l i l i theo tính ạ ả ờ ạch t, n i dung, r i g n mãấ ộ ồ ắ

• Ví d : 1 = do công vi c; 2 = do v (ch ng, ho c ụ ệ ợ ồ ặb ),…, và 99 = nguyên nhân khácồ

Page 17: Spss lesson #1 #4.1 (Vietnamese)

3. Giao di n c a SPSSệ ủ

• Kh i đ ng SPSS: có m t s cách sau:ở ộ ộ ố– Đ a ch chu t đ n bi u t ng SPSS trên màn hình, kích đúp ư ỏ ộ ế ể ượ

vào nó;– Vào Start/Program/SPSS– Có th m b ng cách kích đúp vào m t file SPSS nào đóể ở ằ ộ

• Sau khi kh i đ ng, b n t t c a s màu xám “what would you like to ở ộ ạ ắ ử ổdo?” đi và b t đ u làm vi c v i SPSSắ ầ ệ ớ

• M m t file đã có s n: vào File/Open/Data; chú ý t t c các file ở ộ ẵ ấ ảSPSS đ u có đuôi .savề

• Ghi l i file đang làm vi c: ch n File/Save; ho c ch n bi u t ng ạ ệ ọ ặ ọ ể ượSave (n u có)ế

• M nhi u file m t lúc: ch c n vào File/Open/file c n mở ề ộ ỉ ầ ầ ở• T o file m i: Ch n File/Newạ ớ ọ

Page 18: Spss lesson #1 #4.1 (Vietnamese)

3. Giao di n c a SPSS (ti p)ệ ủ ế• Các thành ph n chính trong giao di n: Data ầ ệ

Editor; Viewer; Pivot Table Editor; và Syntax Editor– Data Editor luôn xu t hi n khi b n analyze d li uấ ệ ạ ữ ệ– Viewer luôn xu t hi n khi b n xem k t qu c a vi c ấ ệ ạ ế ả ủ ệ

phân tích (analyzing). Khi b n đang th c hi n ạ ự ệanalyzing thì Viewer s không xu t hi n.ẽ ấ ệ

• Chú ý: m i phiên b n SPSS khác nhau, các giao ỗ ảdi n có th khác nhau, nh ng b n đ u có th ệ ể ư ạ ề ểtìm th y chúng trong ph n Window trên thanh ấ ầth c đ n (menu bar) ự ơ

Page 19: Spss lesson #1 #4.1 (Vietnamese)

3. Giao di n c a SPSS (ti p)ệ ủ ế

• Giao di n ệ Data Editor: t đây b n nhìn th y ừ ạ ấn i dung file d li u c a b nộ ữ ệ ủ ạ

• B n có th làm gì trên c a s Data Editor?ạ ể ử ổ– M /đóng m t file m i/cũở ộ ớ– Ch nh s a d li u/ ghi l i fileỉ ử ữ ệ ạ– Làm m t s phân tích trên file d li uộ ố ữ ệ

• Ví d : m file survey3ED.savụ ở

Page 20: Spss lesson #1 #4.1 (Vietnamese)
Page 21: Spss lesson #1 #4.1 (Vietnamese)

3. Giao di n c a SPSS (ti p)ệ ủ ế• Giao di n Viewer: T đ ng đ c m ra khi ta ệ ự ộ ượ ở

b t đ u làm b t kỳ phân tích nàoắ ầ ấ– Mô t k t qu c a các phân tíchả ế ả ủ– Các k t qu c a s này có th đ c sao chép ra ế ả ở ử ổ ể ượ

Word– Bao g m 2 ph n: bên trái li t kê t t c nh ng n i ồ ầ ệ ấ ả ữ ộ

dung mà b n đã th c hi n phân tích. Bên ph i là ạ ự ệ ảcác k t qu chi ti t cho các phân tích (mô t bên ế ả ế ảtrái)

– Ví d :ụ

Page 22: Spss lesson #1 #4.1 (Vietnamese)
Page 23: Spss lesson #1 #4.1 (Vietnamese)

3. Giao di n c a SPSS (ti p)ệ ủ ế

• Ghi l i k t qu : trên giao di n k t qu , ch n ạ ế ả ệ ế ả ọSave

• In k t qu : ch n ph n bên trái, sang bên ph i ế ả ọ ầ ảch n ph n c n in (bôi đen – s d ng phím ọ ầ ầ ử ụcontrol và chu t trái)ộ

• Các giao di n khác: Nghiên c u sau khi đã ệ ứth c hànhự

Page 24: Spss lesson #1 #4.1 (Vietnamese)

Ph n 2. Chu n b file d li uầ ẩ ị ữ ệ(T o file d li u và nh p li u)ạ ữ ệ ậ ệ

Page 25: Spss lesson #1 #4.1 (Vietnamese)

Ph n 2. Chu n b file d li uầ ẩ ị ữ ệ(4. T o file d li u và nh p li u)ạ ữ ệ ậ ệ

• (Chú ý: ta có th thay đ i l a ch n bi u hi n c a ể ổ ự ọ ể ệ ủSPSS tr c khi t o file d li u)ướ ạ ữ ệ

• Đ nh d ng bi n: tr c khi nh p li u, b n c n ị ạ ế ướ ậ ệ ạ ầđ nh nghĩa bi n. Vi c này đ c s d ng k t h p ị ế ệ ượ ử ụ ế ợgi a Codebook và giao di n Data Editorữ ệ

• Các b c ti n hành đ nh d ng bi n:ướ ế ị ạ ế– M codebook ra (trang 3, file Word;n u không ph i ở ế ả

t o codebook tr c)ạ ướ– T o m t file m i trên SPSS, vào giao di n Data Editor, ạ ộ ớ ệ

vào giao di n Variable Viewệ

Page 26: Spss lesson #1 #4.1 (Vietnamese)
Page 27: Spss lesson #1 #4.1 (Vietnamese)

Đ nh nghĩa bi nị ế (Các khai báo)

• Name: S d ng tên nh trong codebookử ụ ư• Type (d ng bi n): d ng m c đ nh là s (numeric), n u mu n thay ạ ế ạ ặ ị ố ế ố

đ i d ng (ví d dùng d ng ch ) thì nh n chu t ph i, ho c đ a ổ ạ ụ ạ ữ ấ ộ ả ặ ưchu t vào ô ng v i bi n và d ng bi n và ch n ki u khác (ví d v i ộ ứ ớ ế ạ ế ọ ể ụ ớch thì dùng string.ữ

• Width (đ r ng): th ng là 8 ký tộ ộ ườ ự• Decimal (s th p phân): ch nh s ch s th p phân sau d u ph yố ậ ỉ ố ữ ố ậ ấ ẩ• Label (gi i thích tên bi n): ph n này cho phép b n gi i thích tên ả ế ầ ạ ả

bi n dài h n 8 ký t . Ví d bi n “TMAST” có th đ c gi i thích là ế ơ ự ụ ế ể ượ ả“Total Mastery”

• Value (giá tr bi n): ph n này cho phép đ nh nghĩa giá tr cho bi n ị ế ầ ị ị ếđã đ c mã hóaượ

Page 28: Spss lesson #1 #4.1 (Vietnamese)

Đ nh nghĩa bi nị ế (Các khai báo)

• Ví d v đ nh nghĩa bi n:ụ ề ị ếB n đang mu n đ nh nghĩa bi n cho thông tin v gi i tính ạ ố ị ế ề ớ(câu h i 1 trong phi u đi u tra); ng i tr l i s đ a ra các ỏ ế ề ườ ả ờ ẽ ưl a ch n ho c là male (nam), ho c là female (nự ọ ặ ặ )ữ– B c 1: hãy t o codebook (ho c m codebook có s n ra): b n s ướ ạ ặ ở ẵ ạ ẽ

th y tên bi n cho gi i tính là sex, mô t cho bi n là: 1 = male, 2 = ấ ế ớ ả ếfemale

– B c 2: hãy khai báo nh ng thông tin trên vào c a s Data Editor, ướ ữ ử ổph n Variable wiewầ

Page 29: Spss lesson #1 #4.1 (Vietnamese)

• Align (d ng l ): m c đ nh là l bên ph iạ ề ặ ị ề ả• Measure (ki u s li u): M c đ nh s là scale, ể ố ệ ặ ị ẽ

t c là ki u s li u liên t c đo l ng d i d ng ứ ể ố ệ ụ ườ ướ ạinterval ho c ratio. N u s li u là d ng phân ặ ế ố ệ ạlo i (categorical data) thì ch n Nominal, n u ạ ọ ếs li u là th t (ho c ranking) thì ch n ố ệ ứ ự ặ ọOrdinal.

Đ nh nghĩa bi nị ế (Các khai báo)

Page 30: Spss lesson #1 #4.1 (Vietnamese)

Đ nh nghĩa bi n (ti p)ị ế ếVí d 1ụ

• M m t file SPSS m i raở ộ ớ• M file phi u đi u tra và codebook survey (file ở ế ề

Word)ra• Ti n hành các thao tác đ nh nghĩa bi n cho t ng bi nế ị ế ừ ế

Page 31: Spss lesson #1 #4.1 (Vietnamese)

Nh p li u trong SPSSậ ệ• Sau khi đã đ nh nghĩa bi n xong, b n có th s n sàng cho vi c nh p li u ị ế ạ ể ẵ ệ ậ ệ

(nh p s li u) vào SPSS. ậ ố ệ Hãy chu n b s n t p phi u đi u tra và codebook ẩ ị ẵ ậ ế ềđ t tr c m t.ặ ướ ặ

• Các b c nh p li u nh sau:ướ ậ ệ ư1. Ch n c a s Data View (ho c sheet Data View) trên cùng c a s Data ọ ử ổ ặ ử ổ

Editor. Hãy nhìn xem k t qu b n đã làm ế ả ạ ở Ví d 1 ụ trong ph n đ nh nghĩa ầ ịbi nế

2. D a chu t vào ô đ u tiên trong file d li u. Th nghĩ xem b n s nh p ư ộ ầ ữ ệ ử ạ ẽ ậthông tin gì vào ô này??? (t t nhiên là s 1 cho ID đ u tiên r i).ấ ố ầ ồ

3. Chuy n chu t sang ô bên ph i đ đi n thông tin cho bi n th hai c a ID ể ộ ả ể ề ế ứ ủth nh t (case th nh t ho c phi u đi u tra th nh t)ứ ấ ứ ấ ặ ế ề ứ ấ

4. Ti p t c chuy n chu t sang các ô bên ph i và đi n thông tin, hãy ch c ch n ế ụ ể ộ ả ề ắ ắlà thông tin đ c đi n đúng. Đ n đây b n đã nh p xong s li u cho phi u ượ ề ế ạ ậ ố ệ ếđi u tra đ u tiên.ề ầ

5. n nút home trên bàn phím đ chu t ch y v ô ban đ u, chuy n nó xu ng Ấ ể ộ ạ ề ầ ể ốdòng th hai, l p l i các công vi c nh đ i v i phi u đi u tra th nh t ứ ặ ạ ệ ư ố ớ ế ề ứ ấ(case 1) cho phi u đi u tra th 2 (case 2)ế ề ứ

6. N u mu n s a l i giá tr c a m t bi n nào đó, b n ch c n n chu t vào nó ế ố ử ạ ị ủ ộ ế ạ ỉ ầ ấ ộ(vào ô c a bi n ng v i case đó) và đi n l i giá tr đúng.ủ ế ứ ớ ề ạ ị

• Chú ý: Hãy th ng xuyên ghi file d li u trong lúc nh p li u, vì SPSS ườ ữ ệ ậ ệkhông t đ ng ghi file cho b n. Đ ng r i ro nhé!!!ự ộ ạ ừ ủ

Page 32: Spss lesson #1 #4.1 (Vietnamese)

Đây là nh ng gì b n s th y sau khi b n hoàn thành ữ ạ ẽ ấ ạnh p li uậ ệ

Page 33: Spss lesson #1 #4.1 (Vietnamese)

Đi u ch nh (thay đ i) file d li uề ỉ ổ ữ ệ

• Các thao tác b n th ng làm đ thay đ i file d li u: thêm (add), xóa (delete), ạ ườ ể ổ ữ ệho c chuy n bi n (move variables); thêm ho c xóa case – t c là toàn b thông tin ặ ể ế ặ ứ ộcho m t phi u đi u tra)ộ ế ề

• Đ th c hi n các thao tác này, đ u tiên m c a s Data Editor/Data Viewể ự ệ ầ ở ử ổ• Delete a case (xóa toàn b thông tin c a m t phi u đi u tra: Chuy n chu t đ n ô ộ ủ ộ ế ề ể ộ ế

đ u tiên c a case c n xóa, nh n nút delete trên bàn phím; ho c ch n edit/clearầ ủ ầ ấ ặ ọ• Insert a case (chèn thêm m t phi u đi u tra): chuy n chu t vào ô đ u tiên c a ộ ế ề ể ộ ầ ủ

case ngay phía d i case mình c n chèn, vào Data/Insert Caseướ ầ• Delete a variable (xóa m t bi n – t c là xoát m t thông tin c a phi u đi u tra): ộ ế ứ ộ ủ ế ề

ch n c t c n xóa, n nút delete trên bàn phímọ ộ ầ ấ• Move an existing variable (Chuy n m t bi n đi ch khác): chuy n sang c a s ể ộ ế ỗ ể ử ổ

Variable View, ch n bi n, gi chu t và chuy n đ n n i mu n chuy nọ ế ữ ộ ể ế ơ ố ể

Page 34: Spss lesson #1 #4.1 (Vietnamese)

Nh p li u t Excelậ ệ ừ

• M t s chú ý quan tr ng:ộ ố ọ

– B n c n có nh ng hi u bi t căn b n v Excelạ ầ ữ ể ế ả ề

– Excel ch có 256 c t (t i đa cho 256 bi n), phi u đi u tra ỉ ộ ố ế ế ề

c a b n có nhi u h n, b n ph i s d ng nhi u sheet, m i ủ ạ ề ơ ạ ả ử ụ ề ỗ

sheet b t đ u b ng bi n ID, sau đó b n nh p riêng r ắ ầ ằ ế ạ ậ ẽ

t ng sheet Excel vào SPSS r i m i ti n hành vi c g p d ừ ồ ớ ế ệ ộ ữ

li u (merge files) trong SPSS (ệ vi c này s đ c chi ti t sauệ ẽ ượ ế )

Page 35: Spss lesson #1 #4.1 (Vietnamese)

Nh p li u t Excelậ ệ ừCác b c ti n hànhướ ế

• B c 1: Set up the variable name (đ t bi n, đ nh nghĩa bi n)ướ ặ ế ị ế1. Tên bi n luôn đ c đ t dòng th nh t c a Excel sheet.ế ượ ặ ở ứ ấ ủ2. Lu t đ t tên bi n: nh trong SPSS (ậ ặ ế ư đã trình bày ph n đ nh nghĩa bi nở ầ ị ế )

• B c 2: Entering data (nh p li u trong Excel)ướ ậ ệ1. Nh p li u cho case đ u tiên (phi u đ u tiên): nh nh p chính xác thông tin ậ ệ ầ ế ầ ớ ậ

cho t ng bi nừ ế2. L p l i quá trình trên cho các bi n còn l i ( các dòng phía d i). ặ ạ ế ạ ở ướ Tuy t đ i ệ ố

không đ c s d ng b t kỳ công th c tính, ho c hàm khi nh p li u trong ượ ử ụ ấ ứ ặ ậ ệExcel. Chú ý ghi fle th ng xuyênườ

3. Ghi file v i đ nh d ng Excel c n th nớ ị ạ ẩ ậ

Page 36: Spss lesson #1 #4.1 (Vietnamese)

Nh p li u t Excelậ ệ ừCác b c ti n hành (ti p)ướ ế ế

• B c 3: Chuy n d li u (đã nh p trong Excel) sang SPSSướ ể ữ ệ ậ1. Đóng file Excel l iạ2. Kh i đ ng SPSS, vào c a s Data Editor, vào File/Open/Data/Files of ở ộ ử ổ

Types ch n Excel, ch n file b n c n m (file v a hoàn thi n b c ọ ọ ạ ầ ở ừ ệ ở ướ1 và 2)

3. Ch n Open/Open Excel Data Source, ch n ọ ọ Read Variable name from the first row of data, ch n Okọ

• B c 4: Ghi l i file d i d ng SPSSướ ạ ướ ạ1. Ch n File/Save As, chú ý trong Save As Type đ c ch n là SPSS ọ ượ ọ

(t c .sav), sau đó ch n Saveứ ọ2. Hi n gi trong c a s Data View, Variable View, b n c n ph i đ nh ệ ờ ử ổ ạ ầ ả ị

nghĩa l i nhãn bi n (Variable Labels - ý nghĩa c a bi n), giá tr bi n ạ ế ủ ế ị ế(Variable Values), và cách đo l ng (Measure) (ườ Gi ng nh ph n đ nh ố ư ầ ịnghĩa bi n trong SPSS đã trình bàyế )

Page 37: Spss lesson #1 #4.1 (Vietnamese)

Tr n file trong SPSS (Merge files)ộ

• Đôi khi b n ph i tr n file: ạ ả ộ– Ví d ụ m i ng i nh p (cho m t s l ng phi u nào đó) trên m t máy ỗ ườ ậ ộ ố ượ ế ộ

tính khác nhau (do đó b n ph i tr n các file thành m t file cu i cùng); ạ ả ộ ộ ố– Ho cặ m i ng i nh p m t ph n c a m i phi u trên các máy tính ỗ ườ ậ ộ ầ ủ ỗ ế

khách nhau ho c sheet khác nhau trong Excel.ặ

• Do đó, có hai d ng tr n file ch y u: ạ ộ ủ ế– Adding cases (t c là thêm các cases vào – b sung d li u t các ứ ổ ữ ệ ừ

phi u đi u tra khác); ế ề– Và (ho c) ặ adding variables (t c là không b sung phi u đi u tra, mà ứ ổ ế ề

ch tr n đ b sung bi n – ví d : m i ng i nh p m t ph n thông tin ỉ ộ ể ổ ế ụ ỗ ườ ậ ộ ầc a phi u đi u tra)ủ ế ề

Page 38: Spss lesson #1 #4.1 (Vietnamese)

Tr n file trong SPSS (Merge files) – ộ D ng Adding cases ạ(T c là thêm thông tin t các phi u đi u tra khác)ứ ừ ế ề

• Chú ý: các cases (các phi u đi u tra) ph i gi ng h t nhau v n i dung ế ề ả ố ệ ề ộ(same variables)

• N u s ID c a các file đ nh tr n là nh nhau (ID = 1,2,3…) thì c n đ i s ế ố ủ ị ộ ư ầ ổ ốID c a m t file tr c khi th c hi n tr n. Cách làm nh sau:ủ ộ ướ ự ệ ộ ư– M m t file c n tr n raở ộ ầ ộ

– Ch n Transform/Compute Variable, ghi ID vào h p Target Variable và “ID ọ ộ+ x” vào h p Numeric Expression. ộ Đ bi t ố ế x là gì???

• Sau khi s ID đã đ c đ i, b n hãy nh nó s là m t codebook m i cho ố ượ ổ ạ ớ ẽ ộ ớb n v i nh ng tr ng h p (cases – ho c phi u đi u tra này). ạ ớ ữ ườ ợ ặ ế ề Đ n đây, ếb n đã s n sàng đ tr n file r iạ ẵ ể ộ ồ .

Page 39: Spss lesson #1 #4.1 (Vietnamese)

Tr n file trong SPSS (Merge files) – ộ D ng Adding cases ạCác b c th c hi nướ ự ệ

1. M file th nh t mà b n mu n tr nở ứ ấ ạ ố ộ

2. Ch n Data/Merge files/ Add Casesọ

3. Ch n An external SPSS data file, ch n file c n ọ ọ ầtr n trong h p An open data set.ộ ộ

4. C n Continue/Ok. Ghi file v i tên m i b ng ọ ớ ớ ằcách vào File/Save As

Page 40: Spss lesson #1 #4.1 (Vietnamese)

Tr n file – D ng ộ ạ Adding variables

• Thao tác này phù h p khi b sung thông tin cho m i case (phi u đi u tra). M i ợ ổ ỗ ế ề ỗcase c n đ c b t đ u b i bi n ID và m t s bi n khác (nh nhau c hai file ầ ượ ắ ầ ở ế ộ ố ế ư ở ảmu n tr n vào nhau)ố ộ

• Các b c th c hi n:ướ ự ệ– B c 1: S p x p m i file theo th t tăng d n c a ID các cases b ng cách ướ ắ ế ỗ ứ ự ầ ủ ằ

Data/Sort Cases/ID

– B c 2: Data/Merge files/ Add Variables, ch n An external SPSS data file, ướ ọch n file c n tr n (N u file c n tr n đang m thì nó s xu t hi n trong h p ọ ầ ộ ế ầ ộ ở ẽ ấ ệ ộAn open dataset)

– B c 3: Trong h p Excluded variables, b n s th y bi n ID đ c li t kê. ướ ộ ạ ẽ ấ ế ượ ệ Ởđây, n u có b t kỳ bi n nào khác đ c li t kê, hãy n vào Rename .ế ấ ế ượ ệ ấ

– B c 4: n vào bi n ID, n vào h p Matche cases on key variables, n vào ướ Ấ ế ấ ộ ấmũi tên đ chuy n ID vào h p Key Variable (có nghĩa là t t c các thông tin s ể ể ộ ấ ả ẽđ c tr n d a trên c s cùng ID – cùng phi u đi u tra). Nh n Continue/OKượ ộ ự ơ ở ế ề ấ

– B c 5: Ghi l i file sau khi tr n v i tên khác: File/Save Asướ ạ ộ ớ

Page 41: Spss lesson #1 #4.1 (Vietnamese)

M t s ti n ích c a SPSS khi chu n b file d li uộ ố ệ ủ ẩ ị ữ ệ

• S p x p file d li u: ắ ế ữ ệ b n có th yêu c u SPSS s p x p file d li u ạ ể ầ ắ ế ữ ệtheo giá tr c a m t bi n nào đó (ví d sex, age,…). Các b c th c ị ủ ộ ế ụ ướ ựhi n nh sau:ệ ư– Data/Sort Cases/Ch n bi n c n s p x p/ Ch n Ascending ho c ọ ế ầ ắ ế ọ ặ

Descending / Ch n Okọ– N u b n mu n file d li u quay l i tr ng thái s p x p theo ID, ế ạ ố ữ ệ ạ ạ ắ ế

ch vi c làm nh trên, nh ng bi n c n s p x p l n này là ID.ỉ ệ ư ư ế ầ ắ ế ầ– Ví d : hãy m file Survey ra và làm cho vài bi nụ ở ế

• Chia tách file d li u: ữ ệ ch ng h n b n mu n so sánh gi a các nhóm ẳ ạ ạ ố ữkhác nhau. Các làm:– Data/Split File/ Compare groups/ ch n bi n mu n so sánh/ Okọ ế ố– Mu n tr l i tr ng thái ban đ u vào Data/Sort Cases/ID/ ố ở ạ ạ ầ

Ascending ho c Descendingặ

Page 42: Spss lesson #1 #4.1 (Vietnamese)

M t s ti n ích c a SPSS khi chu n b file d li u ộ ố ệ ủ ẩ ị ữ ệ(ti p)ế

• Ch n m t s cases ọ ộ ố đ nghiên c u trong c file d li u (ví d b n ch phân ể ứ ả ữ ệ ụ ạ ỉtích cho nam gi i):ớ1. Data/Select Cases/ Ch n If condition is satisfiedọ2. Ch n IFọ3. Ch n bi n đúng v i nhóm b n đang mu n h ng t i (ví d bi n sex)ọ ế ớ ạ ố ướ ớ ụ ế4. Nh n vào mũi tên đ đ a bi n vào h p, nh n vào d u =ấ ể ư ế ộ ấ ấ5. Đi n giá tr c a nhóm trong bi n mà b n đang c n ch n (c n ki m tra ề ị ủ ế ạ ầ ọ ầ ể ở

codebook). Ví d n u b n ch n 1 cho sex có nghĩa là b n ch n nhóm ụ ế ạ ọ ạ ọnam gi iớ

6. Nh n Continue/OKấSau khi ch n xong, b n có th th c hi n m t s phân tích riêng cho nhóm ọ ạ ể ự ệ ộ ố

mà b n đã ch n, ví d phân tích t ng quan (correlation). Sau khi phân ạ ọ ụ ươtích xong, b n c n đ a file d li u v tr ng thái ban đ u:ạ ầ ư ữ ệ ề ạ ầVào Data/Select Cases/ All cases/ Ok

Page 43: Spss lesson #1 #4.1 (Vietnamese)

Ti n ích ệ USING SETS trong SPSS

• Nó là gì? Nó là m t t p h p các thông tin s d ng cho m t m c ộ ậ ợ ử ụ ộ ụđích phân tích nào đó trong SPSS

• T i sao đôi khi l i dùng nó?: ạ ạ vì có th phân tích c a b n s không ể ủ ạ ẽ

c n đ n t t c các thông tin trong file d li u. Ví d , phân tích c a ầ ế ấ ả ữ ệ ụ ủ

b n ch c n dùng đ n các bi n ID, Sex, và m t vài bi n khác. Hãy ạ ỉ ầ ế ế ộ ế

m file Survey3ED ra và th c hành theo các b c mô t ph n sauở ự ướ ả ở ầ

Page 44: Spss lesson #1 #4.1 (Vietnamese)

1. Ch n Utilities/ Define variable setsọ

2. Ch n các bi n mu n phân tích đ a vào m c ọ ế ố ư ụVariables in sets, bao g m các bi n ID, bi n ồ ế ếsex đ n bi n “smoke number”, t t c các ế ế ấ ảbi n Total (b t đ u t bi n “Total ế ắ ầ ừ ếOptimism”)

3. Trong h p Set Name, hãy đ t tên cho set c a ộ ặ ủb n (ví d hãy đ t là Totals)ạ ụ ặ

4. Ch n Add set/Closeọ

Ti n ích ệ USING SETS trong SPSSCác b c thi t l p ướ ế ậ SETS

Page 45: Spss lesson #1 #4.1 (Vietnamese)

• Utilities/ Use variable sets• Ch n set b n v a t o (Totals)/ b l a ch n ọ ạ ừ ạ ỏ ự ọ

Allvariables/ ch n Newvariables/ Okọ• Sau b c trên, ch có các bi n đ c ch n ướ ỉ ế ượ ọ

xu t hi n trên màn hìnhấ ệ• N u b n không mu n dùng SETS v a t o n , ế ạ ố ừ ạ ữ

hãy:– Utilities/ Use Variable sets/ Allvariables/ Ok

Ti n ích ệ USING SETS trong SPSSKh i đ ng SETS tr c khi s d ng nóở ộ ướ ử ụ

Page 46: Spss lesson #1 #4.1 (Vietnamese)

Ti n ích ệ Data file comments

• Trong ph n Utilities, b n đ c phép comment ầ ạ ượtrên file d li u. Cách làm nh sau:ữ ệ ư– Utilities/Data file Comments– Hãy nh p vào đó nh ng n i dung b n mu n ậ ữ ộ ạ ố

comment, n u b n mu n ghi l i chúng trong file ế ạ ố ạk t qu , hãy nh n vào Display comments in ế ả ấoutput

Page 47: Spss lesson #1 #4.1 (Vietnamese)

Ti n ích ệ Data file information

• Các information trong codebook có th đ c ể ượhi n th trên file c a b n b ng vi c s d ng ể ị ủ ạ ằ ệ ử ụti n ích này. Đ làm đ c đi u đó:ệ ể ượ ề– File/ Display Data file information– Ch n Working file. Nó s activate ph n View ọ ẽ ầ

(output). đó ta s nh n đ c thông tin v file Ở ẽ ậ ượ ềd li u.ữ ệ

Page 48: Spss lesson #1 #4.1 (Vietnamese)

Ti n ích Values Labels Dispalyệ

• Thông th ng b n ch nhìn th y d li u d ng ườ ạ ỉ ấ ữ ệ ạs cho các bi n (ví d 1 cho male, 2 cho n ). ố ế ụ ữNh ng n u mu n nhìn th y thông tin là male, ư ế ố ấho c female cho các cases. Đ th y, hãy:ặ ể ấ– View/ Values Labels

• Đ t t ti n ích này, l p l i thao tác trênể ắ ệ ặ ạ

Page 49: Spss lesson #1 #4.1 (Vietnamese)

5. Ki m tra và làm s ch d li uể ạ ữ ệ

• Tr c khi ti n hành phân tích d li u, vi c t i ướ ế ữ ệ ệ ốquan tr ng là b n ph i ki m tra xem chúng có l i ọ ạ ả ể ỗgì không.

• Ví d v l i d li u: thay vì nh p s 3, b n có th ụ ề ỗ ữ ệ ậ ố ạ ểđã nh p s 35. L i này có th nh h ng nghiêm ậ ố ỗ ể ả ưởtr ng đ n k t qu phân tích t ng quanọ ế ế ả ươ

• Ví d khác là các “outlier”, t c là các giá tr v t ụ ứ ị ượxa (d i ho c trên) so v i nh ng giá tr còn l i ướ ặ ớ ữ ị ạc a c t ng th m uủ ả ổ ể ẫ

• Ví d khác n a: 1 = male; 2 = female đ i v i bi n ụ ữ ố ớ ếsex, v y l i s là giá tr bi n sex khác v i 1, và 2ậ ỗ ẽ ị ế ớ

Page 50: Spss lesson #1 #4.1 (Vietnamese)

Các b c ti n hành ki m tra d li u bao g m:ướ ế ể ữ ệ ồ

• Tr c khi th c hi n: b n hãy m file c n check ra, vào ướ ự ệ ạ ở ầ

Edit/Options/Variables values in lables shown as/ values and

lables (cái này s có ích khi xem k t qu check d li uẽ ế ả ữ ệ )

• B c 1: Ki m tra l i d li u. Vi c đ u tiên là ki m tra giá tr ướ ể ỗ ữ ệ ệ ầ ể ị

c a t ng bi n trong phi u đi u tra c a b n xem li u giá tr ủ ừ ế ế ề ủ ạ ệ ị

c a m t case nào đó có quá cao hay quá th p hay khôngủ ộ ấ

• B c 2 là xác đ nh chính xác đ a ch c a nh ng l i d li u y ướ ị ị ỉ ủ ữ ỗ ữ ệ ấ

và th c hi n s a l i (ho c xóa)ự ệ ử ỗ ặ

Page 51: Spss lesson #1 #4.1 (Vietnamese)

Ki m tra d li u- B c 1: Th c hi n phân tích đ phát hi n ể ữ ệ ướ ự ệ ể ệl iỗ

V i bi n đ nh danh (nominal – categorical variables)ớ ế ị

• M file error3ED.sav ra và làm theo các b c sau:ở ướ

1. Vào Analyze/Descriptive Statistics/Frequencies

2. Ch n bi n b n mu n ki m tra (nh là bi n đ nh danh ho c ọ ế ạ ố ể ớ ế ị ặcategorical, vd: sex, marital, educaton,…)

3. n vào mũi tên đ đ a các bi n c n ch n vào m c bi n c n Ấ ể ư ế ầ ọ ụ ế ầcheck (t c h p Variable)ứ ộ

4. Nh n nút Statistics/Dispersion/Minimum and Maximumấ

5. Continue/Ok ho c ch n Paste đ ghi l i nh ng gì đã làm trong ặ ọ ể ạ ữSyntax Editor (cái này không c n thi t l m!!!ầ ế ắ )

B n s th y k t qu nh slide sau bao g m 2 ph n: m t b ng t ng ạ ẽ ấ ế ả ư ở ồ ầ ộ ả ổh p và các b ng chi ti t cho t ng bi nợ ả ế ừ ế

Page 52: Spss lesson #1 #4.1 (Vietnamese)

Vì b n đã ch n ạ ọEdit/Options/Va

riables values in

lables shown as/

values and

lables tr c khi ướth c hi n phân ự ệtích nên b n m i ạ ớth y c giá tr và ấ ả ịmã c a nó nh ủ ưth này: t c 1 là ế ứSingle, 2 là …

Page 53: Spss lesson #1 #4.1 (Vietnamese)

Ki m tra l i nh th nào khi đã có k t qu phân tích???ể ỗ ư ế ế ả

• Hãy nhìn vào giá tr Minimum và Maximum. ị– Hãy nghĩ v ý nghĩa c a chúng v i t ng bi n (do they make sense?)ề ủ ớ ừ ế– Các giá tr Minimum, Maximum y có n m trong vùng giá tr đã ị ấ ằ ị

đ c quy đ nh cho m i bi n không? N u không, đó là l iượ ị ỗ ế ế ỗ– Ví d : ụ v i phân tích trên, b n hãy đ ý các phân tích cho bi n Sex, ớ ạ ể ế

b n có phát hi n đi u gì b t th ng không? (ạ ệ ề ấ ườ hãy chú ý đ n ếcodebook)

– Ví d (ti p): hãy đ ý c các phân tích cho bi n ụ ế ể ả ế marital và bi n ếeduc.

• Ki m tra c thông tin v s Valid và s Missing.ể ả ề ố ố• Chú ý: m t vài slide n a ta s ch ra chính xác case nào có l i (n u ở ộ ữ ẽ ỉ ỗ ế

có)

Page 54: Spss lesson #1 #4.1 (Vietnamese)

• Analyze/ Descriptive statistics/ Descriptive• Nh n vào bi n c n đ c phân tích và đ a vào h p Variablesấ ế ầ ượ ư ộ• Nh n vào h p Options/ đánh d u vào nh ng tùy ch n: vd Standard ấ ộ ấ ữ ọ

deviation, minimum, maximum• Continue/ Ok• Ví d : ụ s d ng file erro3ED.sav và ki m tra cho bi n age. K t qu ki m ử ụ ể ế ế ả ể

tra nh sau:ư

Ki m tra d li u- B c 1: Th c hi n phân tích đ phát hi n ể ữ ệ ướ ự ệ ể ệl iỗ

V i bi n liên t c (interval and ratio variables)ớ ế ụ

• Trong k t qu trên:ế ả– Hãy ki m tra giá tr Minimum và Maximum (ể ị chú ý đ n đ i t ng ch n m u đi u traế ố ượ ọ ẫ ề )– Ki m tra giá tr trung bình (mean). Does it make sense? Nó có phù h p v i nh ng tìm tòi ể ị ợ ớ ữ

tr c đây c a b n? Li u nó có b l ch v m t phía nào không?...ướ ủ ạ ệ ị ệ ề ộ

Page 55: Spss lesson #1 #4.1 (Vietnamese)

Ki m tra d li u: ể ữ ệ B c 2 - Phát hi n và s a l trong file d ướ ệ ử ỗ ữli uệ

• Chú ý tr c khi th c hi n: đ ng c scan file d li u đ phát hi n l i, đi u đó r t m t th i ướ ự ệ ừ ố ữ ệ ể ệ ỗ ề ấ ấ ờgian và g n nh không mang l i k t qu .ầ ư ạ ế ả

• Ví d : quay l i k t qu phân tíchụ ạ ế ả• Trong SPSS có m t s cách giúp b n ch ra chính xác (và nhanh chóng) case nào (phi u đi u ộ ố ạ ỉ ế ề

tra nào) đang b l i m t ho c m t s ch tiêu nào đó.ị ỗ ở ộ ặ ộ ố ỉ• Cách 1 (ph ng pháp 1)ươ

1. Trong c a s Data Editor, vào Data/Sort casesử ổ2. Ch n bi n mà b n đã bi t r ng có l i (vd: sex) và đ a vào h p Sort by/ Ascending ho c ọ ế ạ ế ằ ỗ ư ộ ặ

Descending/ Ok

– Vd: v i bi n sex, hãy ch n descending, nó s giúp b n tìm ra case có giá tr bi n sex =3. ớ ế ọ ẽ ạ ị ếCase nào (phi u đi u tra nào) có l i? B n s làm gì v i nó?ế ề ỗ ạ ẽ ớ

• Cách 2:

– c a s Data Editor, trong sheet data viewingỞ ử ổ– Ch n c t (bi n) mà ta bi t r ng đã có l i (vd: sex)/ Ch n Edit / Findọ ộ ế ế ằ ỗ ọ– Trong h p Search for, hãy ch n giá tr l i mà b n mu n tìm (vd: 3 ộ ọ ị ỗ ạ ố t i sao???ạ )

– Ch n Search Forward (ho c Find Next). SPSS s check kh p file d li u đ tìm ra v trí ọ ặ ẽ ắ ữ ệ ể ịc a bi n b l i. Hãy take some note đ bi t v trí c n ph i s a trong file d li u.ủ ế ị ỗ ể ế ị ầ ả ử ữ ệ

– Ti p t c n vào Find Next đ tìm ra v trí có d li u saiế ụ ấ ể ị ữ ệ

Page 56: Spss lesson #1 #4.1 (Vietnamese)

Sau khi th c hi n check và correct l i xong, hãy ự ệ ỗth l i vi c ki m tra l i vì r t có th trong lúc s a ử ạ ệ ể ỗ ấ ể ửl i (ỗ có th do tay chân lóng ngóngể ) b n đã t o ra ạ ạ

m t s l i khác. Đ làm đi u này, hãy quay l i ộ ố ỗ ể ề ạb c 1 (ướ frequencies cho bi n nominal và ế

descriptive cho bi n continuous)ế

Page 57: Spss lesson #1 #4.1 (Vietnamese)

• Ch c năng này cho phép xem m t ph n thông tin ứ ộ ầcho t ng case. Ví d : xem thông tin v gi i tính.ừ ụ ề ớ

• Các b c th c hi n:ướ ự ệ– Nh n vào Analyze/ Reports/ Summarize Casesấ– Ch n ID và các bi n khác c n xem xét (sex,…)ọ ế ầ– B l a ch n Limit cases to first 100ỏ ự ọ– Ch n Statistics/ B l a ch n Number of cases/ ọ ỏ ự ọ

Continue– Trong Option, b Subheadings for totals/ Continue/ ỏ

Ok

Ki m tra d li u: ể ữ ệS d ng ch c năng Case Summaries ử ụ ứ

(not highly recommended)

Page 58: Spss lesson #1 #4.1 (Vietnamese)
Page 59: Spss lesson #1 #4.1 (Vietnamese)

PH N 3. M T S PHÂN TÍCH CĂN B NẦ Ộ Ố Ả6. Phân tích th ng kê mô tố ả

• Chú ý: hãy ch c ch n r ng d li u c a b n đã đ c ki m tra và s a l i ắ ắ ằ ữ ệ ủ ạ ượ ể ử ỗtr c khi ti n hành phân tích nàyướ ế

• Phân tích th ng kê mô t đ làm gì?ố ả ể– Đ mô t đ c tính c a m u mà b n s trình bày trong ph n ể ả ặ ủ ẫ ạ ẽ ầ Ph ng ươ

pháp nghiên c u ứ (trong báo cáo nghiên c u)ứ– Đ ki m tra xem các bi n có ể ể ế vi ph m các gi đ nh c a k thu t ạ ả ị ủ ỹ ậ

th ng kêố s s d ng đ tr l i câu h i nghiên c u hay không?ẽ ử ụ ể ả ờ ỏ ứ– Giúp tr l i m t s câu h i nghiên c u c thả ờ ộ ố ỏ ứ ụ ể

• Thông th ng, các th ng kê mô t bao g m giá tr trung bình (mean), đ ườ ố ả ồ ị ộl ch chu n (standard deviation), m c đ bao ph c a bi n (range of ệ ẩ ứ ộ ủ ủ ếscores), đ nghiêng, ho c l ch (skewness), và đ nh n (kurtosis)ộ ặ ệ ộ ọ

• Các th ng kê này có th đ c ti n hành b ng vi c s d ng: Frequencies, ố ể ượ ế ằ ệ ử ụDescriptive, ho c Explore trong ph n Analyze/ Descriptive Statisticsặ ầ

Page 60: Spss lesson #1 #4.1 (Vietnamese)

Ví d v đ nghiêng (skewness) và đ l ch ụ ề ộ ộ ệ(kurtosis)

Page 61: Spss lesson #1 #4.1 (Vietnamese)

PHÂN TÍCH TH NG KÊ MÔ T Ố ẢCHO BI N Đ NH DANHẾ Ị

• Phân tích TKMT v i bi n đ nh danh giúp đ a ra th ng kê xem bao nhiêu ớ ế ị ư ống i đã đ ng thu n v i m t tr l i c th . Vd: males, femalesườ ồ ậ ớ ộ ả ờ ụ ể

• Tuy nhiên, phân tích này s không có ý nghĩa n u tính ra các giá tr mean, ẽ ế ịstandard deviation.

• Các b c th c hi n: hãy m file survey3ED.saveướ ự ệ ở1. Trên c a s Data Editor, ch n Analyze/ Descriptive Statistics/ ử ổ ọ

Frequencies

2. Ch n bi n c n phân tích đ a vào h p Variablesọ ế ầ ư ộ3. Ch n Continue/ Okọ

Các k t qu này có v n đ gì ế ả ấ ềkhông? Ch liên quan đ n gi ỉ ế ảđ nh c a k thu t th ng kêị ủ ỹ ậ ố

Page 62: Spss lesson #1 #4.1 (Vietnamese)

PHÂN TÍCH TH NG KÊ MÔ T Ố ẢCho bi n liên t cế ụ

• Ch n Analyze/ Descriptive Statistics/ Descriptivesọ• Ch n bi n d đ nh phân tích đ a vào h p Variablesọ ế ự ị ư ộ• Vào Options/ ch n mean, standard deviation, minimum, maximum, ọ

skewness, kurtosis• Continue/ Ok

Page 63: Spss lesson #1 #4.1 (Vietnamese)

Đ c k t qu phân tích trên nh th nào, đ làm ọ ế ả ư ế ểgì???

• Các thông tin v mean, range, standard deviation th ng đ c dùng cho ề ườ ượph n ầ Ph ng pháp nghiên c uươ ứ trong báo cáo (mô t v m u đi u tra)ả ề ẫ ề

• Thông tin v skewness và kurtosis cung c p thông tin đ n phân b (phân ề ấ ế ốph i) c a bi n.ố ủ ế– Skewness là đ nghiêng (hay cân x ng), kurtosis nói đ n đ b t (đ ộ ứ ế ộ ẹ ộ

nh n) trong phân ph i c a bi n. Trong phân ph i chu n, ta s có ọ ố ủ ế ố ẩ ẽskewness và kurtosis b ng 0ằ

– N u Skewness >0, phân b s l ch trái v phía giá tr th p, ng c l i ế ố ẽ ệ ề ị ấ ượ ạphân b l ch ph i v giá tr caoố ệ ả ề ị

– N u kurtosis >0, các giá tr t p trung hai bên giá tr trung bình nhi u ế ị ậ ở ị ềh n, đ ng phân ph i h p và có đuôi dài sang hai bên. Ng c l i, ơ ườ ố ẹ ượ ạđ ng phân ph i ph ng h n.ườ ố ẳ ơ

– Đ i v i nh ng dung l ng m u trên 200 thì vi c ki m tra Skewness có ố ớ ữ ượ ẫ ệ ểth tricky (ể ta ch c n bi t v y thôiỉ ầ ế ậ )

Page 64: Spss lesson #1 #4.1 (Vietnamese)

Đ nh n v t chu nộ ọ ượ ẩ

Đ nh n chu nộ ọ ẩ

Đ nh n d i ộ ọ ướchu nẩ

Page 65: Spss lesson #1 #4.1 (Vietnamese)

THI U D LI U (Ế Ữ Ệ MISSING DATA) • Trong nghiên c u, hi m khi b n thu th p đ y đ thông tin. Do đó, hãy quan tâm ứ ế ạ ậ ầ ủ

các d li u b thi uữ ệ ị ế• B n có th ch y Descriptive đ tìm ra t l % các giá tr b thi u cho m i bi nạ ể ạ ể ỷ ệ ị ị ế ỗ ế• Khi có quá nhi u missing data, hãy t đ t ra câu h i:ề ự ặ ỏ

– Đi u đó có ph i do ng u nhiên không? Vd: dân nuôi l n th rong, không cho ề ả ẫ ợ ảăn.

– Đó có ph i là m t lý do h th ng? Vd: r t nhi u ph n không tr l i v s ả ộ ệ ố ấ ề ụ ữ ả ờ ề ốtu i c a hổ ủ ọ

• Trong phân tích, ta ph i x lý v i các s li u missing nh th nào??? ả ử ớ ố ệ ư ế R t may ấSPSS đã có nh ng l u ý cho vi c này!!!ữ ư ệ– V i b t kỳ phân tích nào, hãy nh n vào nút Options ớ ấ ấ– Ch n ọ Exclude cases listwise: SPSS s ch đ a vào n i dung phân tích đ i v i ẽ ỉ ư ộ ố ớ

nh ng cases mà có đ y đ d li u cho t t c các bi n c n phân tích (đ ng ữ ầ ủ ữ ệ ấ ả ế ầ ồth i)ờ . Khá nguy hi m!!! N u b ép bu c thì hãy ch n!!!ể ế ị ộ ọ

– Exclude cases pairwise: SPSS s lo i tr case không có thông tin c a bi n ẽ ạ ừ ủ ếđ c phân tích, tuy nhiên n u thông tin cho bi n khác là đ y đ thì SPSS l i ượ ế ế ầ ủ ạđ a case y vào phân tích. ư ấ Nên ch n!!!ọ

– Replicate with mean: SPSS s t đ ng gán giá tr trung bình cho các case b ẽ ự ộ ị ịmiss thông tin. Cũng r t nguy hi m, đ c bi n u d li u b thi u quá ấ ể ặ ệ ế ữ ệ ị ếnhi u!!!ề

Page 66: Spss lesson #1 #4.1 (Vietnamese)

Ví d v các l a ch n phân tích v i ụ ề ự ọ ớ missing data

Page 67: Spss lesson #1 #4.1 (Vietnamese)

ĐÁNH GIÁ PHÂN PH I CHU NỐ Ẩ

• Vi c xem xét xem d li u (s li u) có chu n hay không cũng có th đ c th c ệ ữ ệ ố ệ ẩ ể ượ ựhi n b i phân tích ệ ở Skewness và Kurtosis. Tuy nhiên hai giá tr này nên b ng bao ị ằnhiêu thì c n ph i…???ầ ả

• Th ng kê mô t có th giúp ta xem xét đ “ố ả ể ộ chu nẩ ” trong phân ph i c a d li uố ủ ữ ệ• Các b c th c hi n: hãy m t p survey3ED raướ ự ệ ở ệ

1. Vào Analyze/ Descriptive Statistics/ Explore

2. Ch n bi n mu n phân tích (vd: total perceived stress) đ a vào h p ọ ế ố ư ộDependent List

3. Trong h p Label Cases by, ch n bi n IDộ ọ ế

4. Trong h p Display, nh ch n c hai bi n trênộ ớ ọ ả ế

5. Ch n Statistics/ Descriptive and Outliersọ

6. Plots/ Histogram/ Normality plots with tests/ Continue

7. Options/ Missing values/ Exclude cases pairwise/ Continue/ Ok

Page 68: Spss lesson #1 #4.1 (Vietnamese)

K t qu phân tích nh sau:ế ả ư

Page 69: Spss lesson #1 #4.1 (Vietnamese)
Page 70: Spss lesson #1 #4.1 (Vietnamese)

Đ ng th ng th hi n phân ph i chu n, còn đ ng ch m th hi n phân ườ ẳ ể ệ ố ẩ ườ ấ ể ệph i th c c a m u ố ự ủ ẫ

Page 71: Spss lesson #1 #4.1 (Vietnamese)

Đ c k t qu phân tích Normality th nào?ọ ế ả ế• Hãy nhìn vào b ng Descriptives, các thông tin quan tr ng c n quan tâm ả ọ ầ

g m có:ồ– 5% Trimmed mean: giá tr trung bình c a m u khi 5% các s li u có giá tr cao ị ủ ẫ ố ệ ị

nh t và 5% giá tr th p nh t đ c lo i ra (trimmed) kh i m u. Hãy nghĩ v ý ấ ị ấ ấ ượ ạ ỏ ẫ ềnghĩa c a giá tr trung bình này???ủ ị

– Hãy chú ý đ n giá tr c a đ nghiêng (skewness) và đ nh n (kurtosis)ế ị ủ ộ ộ ọ

• Trong b ng Test of Normality, hãy chú ý đ n giá tr ki m đ nh Kolmogorov. ả ế ị ể ịN u giá tr này > 0.05 thì s li u là chu n, và ng c l iế ị ố ệ ẩ ượ ạ

• Hình d ng c a phân ph i đ c mô t bi u đ Histogram. Hãy nhìn vào đó ạ ủ ố ượ ả ở ể ồxem nó có d ng hình m t qu chuông (ho c g n gi ng nh v y) không?ạ ộ ả ặ ầ ố ư ậ

• Cu i cùng, hãy nhìn vào bi u đ hình h p (Box plot), cái h p y t đáy d i ố ể ồ ộ ộ ấ ừ ướlên đáy trên mô t cho 50% s li u c a m u (các s li u gi a m u). B t ả ố ệ ủ ẫ ố ệ ở ữ ẫ ấkỳ nh ng đi m nào đ c li t kê ngoài ph m vi hai đ ng k song song ữ ể ượ ệ ở ạ ườ ẻv i hai đáy h p đ u đ c coi là các outliers c a dãy s li u (t c là nh ng s ớ ộ ề ượ ủ ố ệ ứ ữ ốli u quá cao, ho c quá th p so v i các s li u khác trong m u)ệ ặ ấ ớ ố ệ ẫ

Page 72: Spss lesson #1 #4.1 (Vietnamese)

Bài t p ph n 3, m c 6 – th ng kê mô tậ ầ ụ ố ảBài 1 – Kinh doanh (business)

1. Hãy m file staffsurvey3ED.sav ra và s d ng th ng kê mô t đ ở ử ụ ố ả ểtr l i các câu h i sauả ờ ỏa. Hãy cho bi t t l % nhân viên trong t ch c là lao đ ng dài ế ỷ ệ ổ ứ ộ

h n (bi n employstatus)ạ ếb. Th i gian làm vi c trung bình c a nhân viên trong t ch c là ờ ệ ủ ổ ứ

bao nhiêu (bi n service)ếc. T l % s ng i tr l i cho r ng t ch c (đang đ c nghiên ỷ ệ ố ườ ả ờ ằ ổ ứ ượ

c u) là m t n i làm vi c t t là bao nhiêu? (bi n recommend)ứ ộ ơ ệ ố ế2. V n trên file staffsurvey3ED, hãy đánh giá phân b c a bi n t ng ẫ ố ủ ế ổ

m c hài lòng c a nhân viên (bi n totsatis)ứ ủ ếa. Có b t kỳ giá tr nào c a bi n mà b n cho r ng nó quá cao ấ ị ủ ế ạ ằ

ho c quá th p (outlier) không?ặ ấb. Phân b c a bi n totsatis cho m i nhóm có chu n không?ố ủ ế ỗ ẩ

Page 73: Spss lesson #1 #4.1 (Vietnamese)

1. Hãy s d ng th ng kê mô t đ tr l i các câu h i sau:ử ụ ố ả ể ả ờ ỏa. T l % ng i đ c đi u tra là n gi i (bi n gender) là bao ỷ ệ ườ ượ ề ữ ớ ế

nhiêu?

b. Tu i trung bình c a ng i đ c h i trong m u đi u tra là bao ổ ủ ườ ượ ỏ ẫ ềnhiêu?

c. T l % s ng i tr l i cho r ng h có v n đ v i gi c ng là ỷ ệ ố ườ ả ờ ằ ọ ấ ề ớ ấ ủbao nhiêu? (bi n problem)ế

d. Trung v (median) c a th i gian ng m t tu n là bao nhiêu ị ủ ờ ủ ộ ầ(bi n hourwnit)ế

2. Hãy đánh giá phân ph i giá tr c a bi n “ố ị ủ ế ng và các v n đ căng ủ ấ ềth ngẳ ” (totSAS) cho nh ng ng i cho r ng/ không cho r ng h có ữ ườ ằ ằ ọv n đ v i gi c ng (bi n problem)ấ ề ớ ấ ủ ếa. Có giá tr outlier nào không?ịb. V i m i nhóm, giá tr bi n totSAS có phân ph i chu n không?ớ ỗ ị ế ố ẩ

Bài t p ph n 3, m c 6 – th ng kê mô tậ ầ ụ ố ảBài 2 – S c kh e (Health) – ứ ỏ file sleep3ED