33
/* Bài tập PHÂN TÍCH THỐNG KÊ SINH HỌC, KHOA HỌC CÂY TRỒNG VỚI SAS PGS.TS. Lê Quang Hưng Chươ ng 1 THỐNG KÊ CĂN BẢN VÀ PHÂN TÍCH PHƯƠNG SAI (ANOVA) Nguồn số liệu theo dõi thí nghiệm Số liệu được thu thập, xử lý và lưu từ file excel tùy theo kiểu bố trí thí nghiệm. Thí dụ so sánh năng suất (kg/ô 20 m 2 ) năm giống cải ngọt lần lượt là G22, Z15, X31, K14, D25, có thể ghi bằng số nghiệm thức là 1, 2 , 3, 4, 5; hoặc ghi tên giống; được bố trí thí nghiệm kiểu khối đầy đủ hoàn toàn ngẫu nhiên (Randomized Complete Block Design) bốn khối (I, II, III, IV). Năm nghiệm thức thí nghiệm được ghi bằng tên giống trong file excel, khối ghi trước, nghiệm thức ghi sau. Sơ đồ thí nghiệm Chiều biến thiên Hướng dốc cao I 1 9,00 3 7,00 2 10,28 5 10,94 4 9,86 II 2 7,59 1 8,00 5 10,63 4 9,99 3 8,00 III 3 8,23 4 11,77 2 10,15 1 7,00 5 9,81 IV 5 9,90 1 9,12 3 7,40 2 10,00 4 8,00 thấp Cách ghi số liệu lưu trong file excel khoi nthuc nsuat 1 G22 9.00 1 Z15 10.28 1 X31 7.00 1 K14 9.86 1 D25 10.94 2 G22 8.00 2 Z15 7.59 2 X31 8.00 2 K14 9.99 2 D25 10.63 3 G22 7.00 3 Z15 10.15 3 X31 8.23 3 K14 11.77 3 D25 9.81 4 G22 9.12 4 Z15 10.00 4 X31 7.40 4 K14 8.00 4 D25 9.90 1

Bài Tập Phân Tích Thống Kê Sinh Học Khoa Học Cây Trồng Với SAS

Embed Size (px)

DESCRIPTION

Tham khảo

Citation preview

Page 1: Bài Tập Phân Tích Thống Kê Sinh Học Khoa Học Cây Trồng Với SAS

/* Bài tập PHÂN TÍCH THỐNG KÊ SINH HỌC, KHOA HỌC CÂY TRỒNG VỚI SAS PGS.TS. Lê Quang Hưng Chươ ng 1 THỐNG KÊ CĂN BẢN VÀ PHÂN TÍCH PHƯƠNG SAI (ANOVA) Nguồn số liệu theo dõi thí nghiệm Số liệu được thu thập, xử lý và lưu từ file excel tùy theo kiểu bố trí thí nghiệm. Thí dụ so sánh năng suất (kg/ô 20 m2) năm giống cải ngọt lần lượt là G22, Z15, X31, K14, D25, có thể ghi bằng số nghiệm thức là 1, 2 , 3, 4, 5; hoặc ghi tên giống; được bố trí thí nghiệm kiểu khối đầy đủ hoàn toàn ngẫu nhiên (Randomized Complete Block Design) bốn khối (I, II, III, IV). Năm nghiệm thức thí nghiệm được ghi bằng tên giống trong file excel, khối ghi trước, nghiệm thức ghi sau. Sơ đồ thí nghiệm Chiều biến thiên Hướng dốc cao I 1

9,0037,00

210,28

510,94

49,86

II 27,59

18,00

510,63

49,99

38,00

III 38,23

411,77

210,15

17,00

59,81

IV 59,90

19,12

37,40

210,00

48,00

thấp Cách ghi số liệu lưu trong file excel khoi nthuc nsuat

1 G22 9.001 Z15 10.281 X31 7.001 K14 9.861 D25 10.942 G22 8.002 Z15 7.592 X31 8.002 K14 9.992 D25 10.633 G22 7.003 Z15 10.153 X31 8.233 K14 11.773 D25 9.814 G22 9.124 Z15 10.004 X31 7.404 K14 8.004 D25 9.90

1

Page 2: Bài Tập Phân Tích Thống Kê Sinh Học Khoa Học Cây Trồng Với SAS

Trình tự nhập số liệu được sử dụng ký tự đơn giản và giải thích như sau:

DATA; (DATA: tên dữ liệu, ghi thêm tên và kết thúc bằng dấu ;)INPUT K $ T $ Y; (INPUT: nhập biến và có ký tự $ cách khoảng và dấu;) CARDS; (CARDS: lệnh nhập số liệu, kết thúc bằng dấu;) (Copy và paste chỉ có phần số từ file excel trên)

1 G22 9.001 Z15 10.281 X31 7.001 K14 9.861 D25 10.942 G22 8.002 Z15 7.592 X31 8.002 K14 9.992 D25 10.633 G22 7.003 Z15 10.153 X31 8.233 K14 11.773 D25 9.814 G22 9.124 Z15 10.004 X31 7.404 K14 8.004 D25 9.90

; (dấu ; cho biết đã ghi xong số liệu)PROC ANOVA; (Xử lý ANOVA) CLASS K T; (Xếp loại các biến dùng xử lý)MODEL Y = K T; (Mô hình biến phụ thuộc bảng ANOVA)MEANS T / LSD ALPHA=0.05; (Xếp hạng các trung bình theo alpha)TITLE ‘NANG SUAT’; (Đặt tên của chỉ tiêu theo dõi) RUN; (Lệnh xử lý)

Tóm lại các lệnh (command, code) phân tích thống kê cho cách 1 như sau:DATA; INPUT K $ T $ Y; CARDS;….số liệu excel

; PROC ANOVA; CLASS K T; MODEL Y = K T; MEANS T / LSD ALPHA=0.05; TITLE ‘NANG SUAT THUC THU’; RUN;

Input cách 2 như sau:DATA; INPUT KHOI $ NTHUC $ NSUAT; CARDS;….Số liệu excel

; PROC ANOVA; CLASS KHOI NTHUC; MODEL NSUAT = KHOI NTHUC; MEANS NTHUC / LSD ALPHA=0.05; TITLE ‘NANG SUAT THUC THU’; RUN;

* Ghi chú về xếp hạng các nghiệm thức:2

Page 3: Bài Tập Phân Tích Thống Kê Sinh Học Khoa Học Cây Trồng Với SAS

- Thí nghiệm từ hai đến năm nghiệm thức chọn so sánh Fisher’s LSD test, ghi:MEANS NTHUC / LSD; kết quả xếp nhóm mặc định với APHA = 0.05; Least Significant Difference (sai biệt nhỏ nhất có nghĩa). Xếp nhóm ở mức khác biệt p = 0,01 nếu ghi ALPHA = 0.01, thông thường là sau khi kiểm tra kết quả xử lý ANOVA với nghiệm thức có p < 0,01. - Thí nghiệm từ sáu nghiệm thức trở lên chọn Duncan test (Gomez,1984), ghi:MEANS NTHUC / DUNCAN; kết quả xếp nhóm mặc định với APHA = 0.05 (Trịnh Công Thành, 2003). Trắc nghiệm đa đoạn Duncan (Duncan’s Multiple Range Test) xếp nhóm ở mức khác biệt p = 0,01 nếu ghi ALPHA = 0.01. Duncan’s Multiple Range Test xếp nhóm toàn thí nghiệm khi trên bốn nghiệm thức.

Bài tập mẫu 1: */

DATA; INPUT K $ T $ Y; CARDS;

1 G22 9.001 Z15 10.281 X31 7.001 K14 9.861 D25 10.942 G22 8.002 Z15 7.592 X31 8.002 K14 9.992 D25 10.633 G22 7.003 Z15 10.153 X31 8.233 K14 11.773 D25 9.814 G22 9.124 Z15 10.004 X31 7.404 K14 8.004 D25 9.90

; PROC ANOVA; CLASS K T; MODEL Y = K T/; MEANS T / LSD ALPHA=0.05; TITLE ‘NANG SUAT THUC THU’; RUN;

/* Chương 2

3

Page 4: Bài Tập Phân Tích Thống Kê Sinh Học Khoa Học Cây Trồng Với SAS

PHÂN TÍCH PHƯƠNG SAITHÍ NGHIỆM BỐ TRÍ HOÀN TOÀN NGẪU NHIÊN(Completely Randomized Design, CRD)

2.1. Thí nghiệm hoàn toàn ngẫu nhiên một yếu tốÁp dụng trong điều kiện đồng nhất về môi trường, độ dốc, ánh sáng, độ phì nhiêu của đất, bố trí trong phòng thí nghiệm, nhà lưới. Tiện lợi của phương pháp này là các nghiệm thức có số lần lặp lại khác nhau, nhưng hạn chế là ít chính xác khi đơn vị thí nghiệm trong nghiệm thức không đồng nhất. Để khắc phục điều này, cần tăng nhiều số lần lặp lại và kích thước ô phải lớn, do đó tốn kém hơn (Clewer, 2001). 2.1.1. Thí nghiệm so sánh năng suất các giống rau húng quế Thí nghiệm so sánh năng suất (kg/ô) gồm sáu nghiệm thức là sáu giống rau húng quế trồng trong nhà lưới, bố trí trồng theo kiểu hoàn toàn ngẫu nhiên, ba lần lặp lại. Áp dụng xử lý ANOVA và so sánh với phương pháp LSD (Fisher test), Duncan test và Tukey test. Lưu ý sau xử lý phải xem hoặc sửa alpha lại cho phù hợp với bảng trắc nghiệm ANOVA đã tính và xử lý lại. Số liệu nhập như sau:

Bài tập mẫu 2: */

DATA; INPUT T $ Y; CARDS;

S18 12.1A73 11.2F21 12.1G54 14.4K56 11.8M39 12.2S18 13.6A73 11.1F21 12.8G54 14.2K56 11.1M39 13.4S18 12.2A73 11.6F21 12.8G54 14.3K56 10.8M39 13.0

;PROC ANOVA; CLASS T; MODEL Y = T; MEANS T / LSD ALPHA = 0.01;MEANS T / DUNCAN ALPHA =0.01;MEANS T / TUKEY ALPHA =0.01;TITLE ‘NANG SUAT RAU HUNG QUE(TAN/HA)’;

4

Page 5: Bài Tập Phân Tích Thống Kê Sinh Học Khoa Học Cây Trồng Với SAS

RUN;

/* 2.1.2. Thí nghiệm lặp lại không bằng nhau Thí nghiệm so sánh năng suất bắp (tấn/ha) kiểu hoàn toàn ngẫu nhiên với sáu giống từ A1 đến G6 nhưng số lần lặp lại không bằng nhau (2 và 3 lần). */

DATA; INPUT T $ Y; CARDS;

A1 6.7B2 6.1C3 6.0D4 6.2E5 4.9G6 6.6A1 6.8B2 6.0C3 5.9E5 3.5G6 5.7A1 6.5B2 6.1C3 5.4D4 4.5;PROC anova; CLASS T; MODEL Y = T; MEAN T / DUNCAN ALPHA=0.05;TITLE ‘CAC LAP LAI KHAC NHAU’; RUN;

/* 2.2. Thí nghiệm hoàn toàn ngẫu nhiên hai yếu tố

Bài tập thí nghiệm so sánh bón lưu huỳnh S và lân P đến năng suất cây cải xanh trồng trong nhà lưới. Bố trí thí nghiệm CRD, hai yếu tố là S (S1 = không bón lưu huỳnh, S2 = có bón lưu huỳnh) và P (P1 = không bón P, P2 = có bón lân) trên ô cơ sở 20 m2 và được thiết kế theo sơ đồ như sau:

PP1 P2

SS1 11.5 24.3

15.2 28.1S2 13.2 17.5

11.2 19.4

Bài tập mẫu 3: */

5

Page 6: Bài Tập Phân Tích Thống Kê Sinh Học Khoa Học Cây Trồng Với SAS

DATA; INPUT S $ P $ SP $ Y; CARDS;

1 1 S1P1 11.51 2 S1P2 24.31 1 S1P1 15.21 2 S1P2 28.12 1 S2P1 13.22 2 S2P2 17.52 1 S2P1 11.22 2 S2P2 19.4

;PROC GLM; CLASS S P; MODEL Y = S P S*P/ss3; MEAN S / LSD ALPHA=0.05;MEAN P / LSD ALPHA=0.01;TITLE ‘2 YEU TO CRD’;RUN;

/* 2.3. Thí nghiệm hoàn toàn ngẫu nhiên ba yếu tố có tương tác

Thí nghiệm khảo sát ba yếu tố gồm chất điều hòa sinh trưởng nuôi cấy mô: IBA (nồng độ 0,1và 0,5 mg/lít ; BAP (nồng độ 2; 4 và 8 mg/lít) , NAA (nồng độ 0,05; 0,1 và 0,5 mg/lít) ảnh hưởng số chồi phong lan. Bố trí hoàn toàn ngẫu nhiên kiểu 3 x 3 x 2 = 18 nghiệm thức x 3 lần lặp lại = 54 ô. Ký hiệu nghiệm thức là I (IBA), B (BAP), N (NAA). Nồng độ nhập vào ký hiệu biến số: IBA.1 là IBA 0,1 mg/lít, BAP2 là BAP 2 mg/lít, NAA.05 là NAA 0,05 mg/lít.

Mười tám nghiệm thức có thể bố trí ngẫu nhiên như sau cho 1 lần lập lại: T1: I1 B1 N1 T7: I1 B3 N1 T13: I2 B2 N1T2: I1 B1 N2 T8: I1 B3 N2 T14: I2 B2 N2T3: I1 B1 N3 T9: I1 B3 N3 T15: I2 B2 N3T4: I1 B2 N1 T10: I2 B1 N1 T16: I2 B3 N1T5: I1 B2 N2 T11: I2 B1 N2 T17: I2 B3 N2T6: I1 B2 N3 T12: I2 B1 N3 T18: I2 B3 N3

Sơ đồ thí nghiệm kiểu hoàn toàn ngẫu nhiên 3 lần lặp lại:

I1 B2 N2 I1 B1 N1 I2 B2 N2 I1 B1 N2 I2 B3 N2 I1 B2 N3I2 B1 N1 I2 B1 N3 I2 B2 N1 I2 B1 N2 I1 B3 N2 I2 B3 N1I1 B3 N1 I2 B2 N3 I1 B3 N3 I1 B2 N1 I2 B3 N3 I1 B1 N3I1 B1 N1 I1 B1 N2 I1 B2 N2 I1 B2 N3 I2 B2 N3 I2 B3 N1I2 B1 N3 I2 B2 N2 I2 B3 N2 I2 B1 N1 I1 B2 N1 I1 B3 N1I1 B3 N3 I2 B1 N2 I2 B3 N3 I1 B3 N2 I1 B1 N3 I2 B2 N1I2 B1 N3 I2 B2 N2 I1 B2 N2 I1 B3 N3 I1 B3 N1 I2 B1 N2

6

Page 7: Bài Tập Phân Tích Thống Kê Sinh Học Khoa Học Cây Trồng Với SAS

I1 B1 N2 I2 B3 N2 I2 B2 N1 I2 B2 N3 I2 B3 N1 I1 B3 N2I1 B2 N3 I2 B1 N1 I1 B1 N1 I1 B1 N3 I1 B2 N1 I2 B3 N3

* Ghi chú : «IBABAPNAA$25.» là các biến được viết thành 1 từ có khoảng 25 ký tự in ra ở bảng kết quả xử lý.

Bài tập mẫu 4: */

DATA; input IBA BAP NAA Y IBABAPNAA$25.;CARDS;

0.1 2 0.05 21 IBA.1BAP2NAA.050.1 2 0.1 23 IBA.1BAP2NAA.10.1 2 0.5 18 IBA.1BAP2NAA.50.1 4 0.05 14 IBA.1BAP4NAA.050.1 4 0.1 12 IBA.1BAP4NAA.10.1 4 0.5 6 IBA.1BAP4NAA.50.1 8 0.05 17 IBA.1BAP8NAA.050.1 8 0.1 11 IBA.1BAP8NAA.10.1 8 0.5 13 IBA.1BAP8NAA.50.1 2 0.05 19 IBA.1BAP2NAA.050.1 2 0.1 24 IBA.1BAP2NAA.10.1 2 0.5 19 IBA.1BAP2NAA.50.1 4 0.05 13 IBA.1BAP4NAA.050.1 4 0.1 13 IBA.1BAP4NAA.10.1 4 0.5 7 IBA.1BAP4NAA.50.1 8 0.05 17 IBA.1BAP8NAA.050.1 8 0.1 10 IBA.1BAP8NAA.10.1 8 0.5 14 IBA.1BAP8NAA.50.1 2 0.05 21 IBA.1BAP2NAA.050.1 2 0.1 25 IBA.1BAP2NAA.10.1 2 0.5 19 IBA.1BAP2NAA.50.1 4 0.05 12 IBA.1BAP4NAA.050.1 4 0.1 13 IBA.1BAP4NAA.10.1 4 0.5 8 IBA.1BAP4NAA.50.1 8 0.05 19 IBA.1BAP8NAA.050.1 8 0.1 11 IBA.1BAP8NAA.10.1 8 0.5 12 IBA.1BAP8NAA.50.2 2 0.05 19 IBA.2BAP2NAA.050.2 2 0.1 24 IBA.2BAP2NAA.10.2 2 0.5 20 IBA.2BAP2NAA.50.2 4 0.05 11 IBA.2BAP4NAA.050.2 4 0.1 10 IBA.2BAP4NAA.10.2 4 0.5 5 IBA.2BAP4NAA.50.2 8 0.05 18 IBA.2BAP8NAA.050.2 8 0.1 10 IBA.2BAP8NAA.10.2 8 0.5 14 IBA.2BAP8NAA.50.2 2 0.05 20 IBA.2BAP2NAA.050.2 2 0.1 23 IBA.2BAP2NAA.10.2 2 0.5 18 IBA.2BAP2NAA.50.2 4 0.05 12 IBA.2BAP4NAA.050.2 4 0.1 11 IBA.2BAP4NAA.10.2 4 0.5 6 IBA.2BAP4NAA.5

7

Page 8: Bài Tập Phân Tích Thống Kê Sinh Học Khoa Học Cây Trồng Với SAS

0.2 8 0.05 15 IBA.2BAP8NAA.050.2 8 0.1 12 IBA.2BAP8NAA.10.2 8 0.5 16 IBA.2BAP8NAA.50.2 2 0.05 20 IBA.2BAP2NAA.050.2 2 0.1 24 IBA.2BAP2NAA.10.2 2 0.5 18 IBA.2BAP2NAA.50.2 4 0.05 13 IBA.2BAP4NAA.050.2 4 0.1 12 IBA.2BAP4NAA.10.2 4 0.5 8 IBA.2BAP4NAA.50.2 8 0.05 8 IBA.2BAP8NAA.050.2 8 0.1 12 IBA.2BAP8NAA.10.2 8 0.5 14 IBA.2BAP8NAA.5

; PROC GLM; CLASS IBA BAP NAA; MODEL Y = IBA|BAP|NAA/ss3; MEANS IBA|BAP|NAA / LSD ALPHA=0.01; LSMEANS BAP*NAA / PDIFF=CONTROL ADJUST=DUNNETT;LSMEANS IBA*BAP*NAA / PDIFF=CONTROL ADJUST=DUNNETT;TITLE ‘SO CHOI LAN’; RUN;

PROC GLM; CLASS IBABAPNAA; MODEL Y = IBABAPNAA/ss3; MEANS IBABAPNAA / DUNCAN ALPHA=0.05; RUN;

/* Chương 3

PHÂN TÍCH PHƯƠNG SAITHÍ NGHIỆM KHỐI ĐẦY ĐỦ NGẪU NHIÊN

(Randomized Complete Block Design, RCBD)

3.1. Khối đầy đủ hoàn toàn ngẫu nhiên một yếu tố Đây là kiểu bố trí phổ biến nhất trong nghiên cứu thí nghiệm, được áp dụng ưu tiên so với các cách bố trí khác. Áp dụng cho việc so sánh các giống, loại phân bón trong điều kiện đất đai, ngoại cảnh tương đối ít đồng nhất. Thường có chiều biến thiên của hướng dốc hoặc hướng ánh sáng, độ phì đất, pH, cần điều chỉnh ô phù hợp về kích thước, chiều dài ô. Kiểu RCBD giảm sai số thí nghiệm, nhưng chịu ảnh hưởng của khối.

Thí nghiệm so sánh năng suất hạt đậu phụng ở 9% ẩm độ (kg/ô 20m2) của 5 giống trong 3 khối. Bố trí thí nghiệm theo khối đầy đủ hoàn toàn ngẫu nhiên, ba lần lặp lại, 5 nghiệm thức gồm 5 giống là giống Lỳ và các giống đã tuyển chọn. Tổng số ô = 3 x 5 = 15 ô (k = khối; t = nghiệm thức, tên giống; y = năng suất). Sơ đồ thí nghiệm như sau: Hướng dốc caoI L9801-10 Ly VD2 VD99-3 VD1II VD2 VD1 VD99-3 Ly L9801-10III VD99-3 VD2 VD1 L9801-10 Ly

8

Page 9: Bài Tập Phân Tích Thống Kê Sinh Học Khoa Học Cây Trồng Với SAS

Thấp

Bài tập mẫu 5: */data; input k $ t $ y; cards;

1 VD1 3.39

1 VD2 3.64

1 Ly 4.36

1 VD99-3 3.29

1 L9801-10 3.05

2 VD1 3.25

2 VD2 4.07

2 Ly 3.64

2 VD99-3 2.87

2 L9801-10 3.19

3 VD1 3.74

3 VD2 4.17

3 Ly 3.73

3 VD99-3 3.17

3 L9801-10 3.55;proc anova; class k t; model y = k t; means t /duncan alpha=0.05; title 'Thi nghiem 1 yeu to RCBD';run;

/*3.2. Kiểu ô vuông la tinh (Latin square)

Áp dụng khi có biến thiên hai chiều của các nghiệm thức và cần được khảo sát theo hai hướng, thường là bố trí theo hàng và cột. Bài tập thí nghiệm khảo sát tăng giảm chiều cao lúa mì theo tiêu chuẩn do máy gặt trên sáu lô. Thứ tự ô (I, II, III, IV, V, VI) trên các khu vực A, B, C, D, E, F (số liệu trích từ Barnard, 1994). Chiều cao chồi so sánh với chiều cao thực sự (cm).

Khu vực I f b a d c eII b f d a e cIII c e f b d aIV d c b e a fV e a c f b dVI a d e c f b

Dữ liệu được sắp xếp như sau: hàng (H), cột (C), nghiệm thức (T) và chiều cao (Y).

Bài tập mẫu 6: */

DATA;

9

Page 10: Bài Tập Phân Tích Thống Kê Sinh Học Khoa Học Cây Trồng Với SAS

INPUT H C T $ Y;CARDS;

1 1 f 3.5

1 2 b 4.2

1 3 a 6.7

1 4 d 6.6

1 5 c 4.1

1 6 e 3.8

2 1 b 8.9

2 2 f 1.9

2 3 d 5.8

2 4 a 4.5

2 5 e 2.4

2 6 c 5.8

3 1 c 9.6

3 2 e 3.7

3 3 f -2.7

3 4 b 3.7

3 5 d 6

3 6 a 7

4 1 d 10.5

4 2 c 10.2

4 3 b 4.6

4 4 e 3.7

4 5 a 5.1

4 6 f 3.8

5 1 e 3.1

5 2 a 7.2

5 3 c 4

5 4 f -3.3

5 5 b 3.5

5 6 d 5

6 1 a 5.9

6 2 d 7.6

6 3 e -0.7

6 4 c 3

6 5 f 4

6 6 b 8.6;PROC ANOVA;CLASS H C T;MODEL Y = H C T;MEANS T / DUNCAN ALPHA=0.01;TITLE ‘CHIEU CAO LUA MI’;RUN;

/* 3.3. Khối đầy đủ ngẫu nhiên hai yếu tố có tương tác (interaction)

Kiểu thí nghiệm căn bản này thực hiện để tìm tác động đồng thời của hai yếu tố cần khảo sát.

Thí nghiệm hai yếu tố, yếu tố A có ba nghiệm thức, yếu tố B có năm nghiệm thức Thí nghiệm bố trí trên ba khối đầy đủ ngẫu nhiên, khảo sát năng suất cải dầu Y (kg/ô) do ảnh hưởng ba nồng độ chất điều hòa sinh trưởng (S1, S2, S3) và năm lượng đạm (D1, D2, D3, D4, D5), số liệu trích dẫn ở trang 168 của Clewer (2001).

10

Page 11: Bài Tập Phân Tích Thống Kê Sinh Học Khoa Học Cây Trồng Với SAS

Có hai bước: (1) xử lý ANOVA bằng PROC GLM (General Linear Model), xếp nhóm các nghiệm thức của yếu tố S, D. So sánh tương tác LSMEAN bằng: LSMEANS S*D/PDIFF

ADJUST=DUNNETT; (2) tính khác biệt tương tác của yếu tố S*D dựa trên so sánh giá trị xác suất điều chỉnh (adjust p-values) của PDIFF ADJUST=DUNNETT.

File mẫu xử lý ANOVA và xếp nhóm các nghiệm thức của yếu tố S và D mã hóa bằng số. * Lưu ý sử dụng dấu $ để cách các biến số. Mã hóa bằng chữ với khối (K), nồng độ chất điều hòa sinh trưởng (S) và lượng đạm (D), năng suất cải dầu Y (kg/ô).

Bài tập mẫu 7: */

DATA; INPUT K $ S $ D $ SD $ Y; CARDS;

;PROC GLM; CLASS K S D; MODEL Y = K S D S*D/ss3; MEAN S/LSD;MEAN D/LSD ALPHA=0.01;MEAN S*D/ DUNCAN ALPHA=0.01;LSMEANS S*D / PDIFF ADJUST=DUNNETT ALPHA=0.01; TITLE ‘RCBD 2 YEU TO’;RUN;

PROC GLM; CLASS K SD; MODEL Y = K SD/ss3; MEAN SD / DUNCAN ALPHA=0.01;RUN;

/* 3.4. Thí nghiệm lô phụ (Split plot) có tương tác (interaction)

Thí nghiệm kết hợp các nghiệm thức thành nhóm trong một yếu tố lô chính gọi là kiểu thí nghiệm lô phụ (split plot design). Tùy cách chọn yếu tố nào là chính hay phụ, nhưng áp dụng phổ biến nhất với yếu tố A thường là lô chính (main plot factor) hay là lô lớn (large plots) như cày đất, tưới nước; lô phụ B (subplot factor) hay là lô nhỏ (small plots) như phân bón, giống (Clewer, 2001). Yếu tố A và B được bố trí hoàn toàn ngẫu nhiên, yếu tố B xếp theo lô phụ được xem như là yếu tố để khảo sát so với các giá trị trung bình trong ảnh hưởng của tương tác khối với yếu tố A (K*A), để tính tương tác của tất cả các lô. Tương tác của lô

1 1 1 S1D1 0.91 1 2 S1D2 1.21 1 3 S1D3 1.31 1 4 S1D4 1.81 1 5 S1D5 1.11 2 1 S2D1 0.91 2 2 S2D2 1.11 2 3 S2D3 1.31 2 4 S2D4 1.61 2 5 S2D5 1.91 3 1 S3D1 0.91 3 2 S3D2 1.41 3 3 S3D3 1.31 3 4 S3D4 1.41 3 5 S3D5 1.22 1 1 S1D1 0.92 1 2 S1D2 1.32 1 3 S1D3 1.52 1 4 S1D4 1.92 1 5 S1D5 1.42 2 1 S2D1 0.82 2 2 S2D2 0.92 2 3 S2D3 1.52 2 4 S2D4 1.32 2 5 S2D5 1.62 3 1 S3D1 12 3 2 S3D2 1.22 3 3 S3D3 1.42 3 4 S3D4 1.52 3 5 S3D5 1.13 1 1 S1D1 13 1 2 S1D2 1.23 1 3 S1D3 1.43 1 4 S1D4 2.13 1 5 S1D5 1.23 2 1 S2D1 0.83 2 2 S2D2 0.93 2 3 S2D3 1.13 2 4 S2D4 1.13 2 5 S2D5 1.53 3 1 S3D1 0.73 3 2 S3D2 13 3 3 S3D3 1.43 3 4 S3D4 1.43 3 5 S3D5 1.3

11

Page 12: Bài Tập Phân Tích Thống Kê Sinh Học Khoa Học Cây Trồng Với SAS

phụ được so sánh với sai số thí nghiệm residual (SAS, 1999).

Phải có test giả thiết: TEST H = A E = K*A; (giả thiết null, không khác nhau).Sơ đồ thí nghiệm chung như sau:

Khối I Khối II Khối IIIK2 K1 K3 K1 K2 K3 K1 K3 K2

V2 V4 V1 V4 V2 V4 V1 V4 V3

V4 V2 V3 V1 V3 V1 V3 V3 V1

V3 V1 V4 V3 V1 V2 V2 V1 V2

V1 V3 V2 V2 V4 V3 V4 V2 V4

Thí nghiệm khảo sát năng suất đậu bắp (tấn/ha) do yếu tố khoảng cách trồng và giống. Khoảng cách và giống có thể sử dụng mã hóa bằng chữ số và nguyên tên giống.

• Bài tập sử dụng mã hóa bằng chữ số như sau:Yếu tố K lô chính: ba nghiệm thức về khoảng cách: K1, K2, K3. Yếu tố V lô phụ: bốn giống là V1, V2, V3, V4. Yếu tố KV: yếu tố tương tác của hai yếu tố K và V.Bố trí thí nghiệm trên ba khối đầy đủ, ngẫu nhiên (KHỐI: 1, 2, 3).

Bài tập mẫu 8: */

Data; Input KHOI $ K $ V $ KV $ Y; cards;

1 1 1 K1V1 6.891 1 2 K1V2 6.78

1 1 3 K1V3 6.89

1 1 4 K1V4 7.34

2 1 1 K1V1 6.43

2 1 2 K1V2 6.89

2 1 3 K1V3 7.10

2 1 4 K1V4 7.50

3 1 1 K1V1 6.71

3 1 2 K1V2 7.05

3 1 3 K1V3 7.45

3 1 4 K1V4 7.52

1 2 1 K2V1 8.82

1 2 2 K2V2 9.51

1 2 3 K2V3 7.81

1 2 4 K2V4 7.95

12

Page 13: Bài Tập Phân Tích Thống Kê Sinh Học Khoa Học Cây Trồng Với SAS

2 2 1 K2V1 8.75

2 2 2 K2V2 9.642 2 3 K2V3 8.71

2 2 4 K2V4 6.96

3 2 1 K2V1 8.87

3 2 2 K2V2 9.55

3 2 3 K2V3 9.80

3 2 4 K2V4 7.94

1 3 1 K3V1 10.35

1 3 2 K3V2 11.96

1 3 3 K3V3 10.46

1 3 4 K3V4 10.91

2 3 1 K3V1 10.39

2 3 2 K3V2 11.78

2 3 3 K3V3 10.32

2 3 4 K3V4 10.97

3 3 1 K3V1 10.57

3 3 2 K3V2 10.81

3 3 3 K3V3 10.67

3 3 4 K3V4 11.45;proc glm; class KHOI K V; model Y = KHOI K KHOI*K V K*V/ss3; test h=K e=KHOI*K; means K V K*V/lsd alpha=0.05;lsmeans K*V/pdiff=control adjust=dunnett; title‘ nang suat lo phu tuong tac dunnett’; run;

proc glm; class KHOI KV; model Y = KHOI KV/ss3; means KV/Duncan alpha=0.05; run;

/* 3.5. Thí nghiệm lô sọc (strip plot)

Thí nghiệm bố trí có một yếu tố gồm một dãy các ô cơ sở trong một khối theo một hướng trong khối, và yếu tố thứ hai cũng gồm một dãy các ô cơ sở theo một hướng khác trong khối. Như vậy có một yếu tố theo hướng dọc (vertical) và yếu tố thứ hai theo hướng ngang (horizontal). Các ô cơ sở trong khối được bố trí ngẫu nhiên. Strip plot với bố trí đặc biệt theo ô sọc còn gọi là split-block design. Thí nghiệm áp dụng cho ô cơ sở lớn và liên tục, vì ô cơ sở nhỏ khó thực hiện.

Cần trắc nghiệm giả thiết ảnh hưởng của khối với yếu tố A, ảnh hưởng của khối với yếu tố B. test h=A e=KHOI*A; test h=B e=KHOI*B;

13

Page 14: Bài Tập Phân Tích Thống Kê Sinh Học Khoa Học Cây Trồng Với SAS

Bài tập: thí nghiệm bố trí khối (KHOI) RCBD để tính năng suất lúa mạch Y (kg/ô cơ sở) làm thức ăn gia súc, bón phân kali (K) có ba nghiệm thức : K1 = 0 kg/ha, K2 = 25 kg/ha và K3 = 50 kg/ha. Phân lân (P) có hai nghiệm thức: P1 = 25 kg/ha, P2 = 50 kg/ha. Bón K chạy dọc hết ba ô. Trên các ô bón K, bón P chạy ngang theo góc thẳng (số liệu trích từ Petersen, 1994).

Sơ đồ thí nghiệm như sau:

K3 K1 K2 K1 K3 K2 K2 K1 K3P1 56 32 49 P2 38 62 50 P2 54 44 51P2 67 54 58 P1 52 72 64 P1 63 54 68 Khối 1 Khối 2 Khối 3

Bài tập mẫu 9: */

data; input KHOI $ K $ P $ Y; cards;

1 1 1 321 1 2 541 2 1 491 2 2 581 3 1 561 3 2 672 1 1 382 1 2 522 2 1 502 2 2 642 3 1 622 3 2 723 1 1 443 1 2 543 2 1 543 2 2 633 3 1 513 3 2 68

; proc glm; class KHOI K P; model Y = KHOI K KHOI*K P KHOI*P K*P/ss3; test h=K e=KHOI*K; test h=P e=KHOI*P;means K P K*P/lsd alpha=0.01; lsmeans K/pdiff adjust=dunnett alpha=0.01; title‘STRIP PLOT P 142’; run;

/* 3.6. Thí nghiệm lô phụ của lô phụ (Split Split Plot) 14

Page 15: Bài Tập Phân Tích Thống Kê Sinh Học Khoa Học Cây Trồng Với SAS

Thí nghiệm được bố trí khi thực hiện đồng nhất một kỹ thuật trên lô lớn, điển hình là các nghiệm thức trong lô lớn A (main plot treatments) như khoảng cách trồng, lô phụ B (sub-plot treatments) với các nghiệm thức như giống, và lô phụ của lô phụ C (sub-sub plot treatments) như các lượng N (Kumar, 2008). Bài tập với thí nghiệm khảo sát 3 loại phân bón đến năng suất hạt đậu phụng ở 9% ẩm độ hạt, được bố trí lô lớn A (whole plot factor) có 3 lượng đạm N, trong đó lô phụ B là 2 lượng lân (intermediate size plot, subplot factor) và trong đó có lô phụ của lô phụ nhỏ nhất C là 3 lượng K (sub-subplot factor),. Tất cả cho 1 lần lặp lại (khối) có 3 x 2 x 3 = 18 ô. Bố trí ngẫu nhiên cho từng yếu tố từ lô A đến lô C, 4 lần lặp lại là 4 khối. Bố trí từ trái sang phải theo sơ đồ cho khối 1 như sau:

KHỐI 1

A1B1C2 A1B1C1 A1B1C3A1B2C1 A1B2C3 A1B2C2A3B2C3 A3B2C2 A3B2C1A3B1C2 A3B1C3 A3B1C1A2B2C1 A2B2C3 A2B2C2A2B1C3 A2B1C2 A2B1C1

Số liệu được ghi theo lệnh xử lý và bảng số. Ký hiệu là K: khối, các yếu tố A, B, C và năng suất Y (tấn/ha).

Bài tập mẫu 10: */

DATA; input K A B C $ Y;CARDS;

1 1 1 1 1.191 1 1 2 1.591 1 1 3 1.831 1 2 1 1.391 1 2 2 1.901 1 2 3 2.011 2 1 1 1.451 2 1 2 1.881 2 1 3 1.921 2 2 1 1.901 2 2 2 1.851 2 2 3 2.211 3 1 1 1.171 3 1 2 1.271 3 1 3 1.491 3 2 1 1.041 3 2 2 1.451 3 2 3 1.832 1 1 1 1.27

15

Page 16: Bài Tập Phân Tích Thống Kê Sinh Học Khoa Học Cây Trồng Với SAS

2 1 1 2 1.482 1 1 3 1.862 1 2 1 1.522 1 2 2 2.012 1 2 3 2.182 2 1 1 1.242 2 1 2 1.582 2 1 3 1.632 2 2 1 1.552 2 2 2 1.602 2 2 3 2.182 3 1 1 1.212 3 1 2 1.392 3 1 3 1.502 3 2 1 1.152 3 2 2 1.602 3 2 3 1.893 1 1 1 1.193 1 1 2 1.443 1 1 3 1.463 1 2 1 1.513 1 2 2 1.533 1 2 3 2.033 2 1 1 1.393 2 1 2 1.553 2 1 3 1.363 2 2 1 1.483 2 2 2 1.583 2 2 3 1.953 3 1 1 1.063 3 1 2 1.193 3 1 3 1.223 3 2 1 1.263 3 2 2 1.333 3 2 3 1.444 1 1 1 1.204 1 1 2 1.324 1 1 3 1.194 1 2 1 1.364 1 2 2 1.554 1 2 3 2.144 2 1 1 1.174 2 1 2 1.394 2 1 3 1.434 2 2 1 1.444 2 2 2 1.504 2 2 3 1.884 3 1 1 1.054 3 1 2 1.224 3 1 3 1.19

16

Page 17: Bài Tập Phân Tích Thống Kê Sinh Học Khoa Học Cây Trồng Với SAS

4 3 2 1 1.164 3 2 2 1.564 3 2 3 2.01

;PROC GLM; CLASS K A B C; MODEL Y = K A K*A B A*B K*A*B C A*C B*C A*B*C/ss3; TEST H=A E=K*A; TEST H=B E=K*A*B; TEST H=A*B E=K*A*B;MEANS A B C A*B A*C A*B*C/LSD ALPHA=0.01;

LSMEANS A*B / PDIFF=CONTROL ADJUST=DUNNETT; LSMEANS B*C / PDIFF=CONTROL ADJUST=DUNNETT; TITLE ‘SPLIT SPLIT PLOT’; RUN;

/* 3.7. Thí nghiệm lô phụ của lô sọc (Strip Split Plot)

Thí nghiệm khảo sát năng suất cải xanh ảnh hưởng do khoảng cách trồng và lượng phân bón đạm (N), cần thực hiện trên lô lớn và liên tục, bốn lần lặp lại.

Trong khối 1 (lặp lại 1), hai khoảng cách được bố trí theo lô sọc đứng (vertical strip), trong đó bốn giống bố trí ngẫu nhiên lô phụ trong một lô lượng phân bón N. Lượng N bố trí lô sọc ngang (horizonal strip) qua các lô phụ (SAS, 2004).

Các yếu tố gồm: khoảng cách có hai loại (kcach1, kcach2), giống có 4 giống (giong1, giong2, giong3, giong4), lượng đạm có 3 mức (luongN1, luongN2, luongN3), ba khối (lần lặp lại: khoi 1, 2, 3) và năng suất cải xanh (y).

Sơ đồ bố trí thí nghiệm cho 1 khối như sau:

KHỐI I

Kcach1 Kcach2

LuongN1 giong1 giong3 giong2 giong4 giong3 giong2 giong1 giong4

LuongN3 giong2 giong4 giong3 giong1 giong2 giong1 giong4 giong3LuongN2 giong3 giong2 giong1 giong4 giong4 giong3 giong2 giong1

Số liệu được ghi như bảng sau, lưu ý yếu tố kcNgiong là để xếp hạng các nghiệm thức trong tương tác của khoảng cách, lượng đạm và giống; nhưng không có khác biệt thống kê theo bảng

17

Page 18: Bài Tập Phân Tích Thống Kê Sinh Học Khoa Học Cây Trồng Với SAS

ANOVA, nhưng dùng các trị số để ghi và bảng kết quả. Chỉ có tương tác khoảng cách và giống vì vậy cần so sánh Dunnett hai yếu tố này. Câu lệnh ghi như sau: lsmeans kcach*giong / pdiff=control adjust=dunnett;

Bài tập mẫu 1: */

Data;Input khoi $ kcach $ luongN $ giong $ kcNgiong $ y;Cards;

1 1 1 1 KC1N1G1 11

1 1 1 2 KC1N1G2 18

1 1 1 3 KC1N1G3 12

1 1 1 4 KC1N1G4 14

1 1 2 1 KC1N2G1 13

1 1 2 2 KC1N2G2 16

1 1 2 3 KC1N2G3 15

1 1 2 4 KC1N2G4 12

1 1 3 1 KC1N3G1 11

1 1 3 2 KC1N3G2 19

1 1 3 3 KC1N3G3 12

1 1 3 4 KC1N3G4 14

1 2 1 1 KC2N1G1 13

1 2 1 2 KC2N1G2 15

1 2 1 3 KC2N1G3 11

1 2 1 4 KC2N1G4 10

1 2 2 1 KC2N2G1 9

1 2 2 2 KC2N2G2 18

1 2 2 3 KC2N2G3 12

1 2 2 4 KC2N2G4 15

1 2 3 1 KC2N3G1 14

1 2 3 2 KC2N3G2 16

1 2 3 3 KC2N3G3 16

1 2 3 4 KC2N3G4 12

2 1 1 1 KC1N1G1 15

2 1 1 2 KC1N1G2 15

2 1 1 3 KC1N1G3 9

2 1 1 4 KC1N1G4 10

2 1 2 1 KC1N2G1 11

2 1 2 2 KC1N2G2 17

2 1 2 3 KC1N2G3 13

2 1 2 4 KC1N2G4 12

2 1 3 1 KC1N3G1 11

2 1 3 2 KC1N3G2 19

18

Page 19: Bài Tập Phân Tích Thống Kê Sinh Học Khoa Học Cây Trồng Với SAS

2 1 3 3 KC1N3G3 9

2 1 3 4 KC1N3G4 11

2 2 1 1 KC2N1G1 13

2 2 1 2 KC2N1G2 17

2 2 1 3 KC2N1G3 14

2 2 1 4 KC2N1G4 12

2 2 2 1 KC2N2G1 12

2 2 2 2 KC2N2G2 15

2 2 2 3 KC2N2G3 16

2 2 2 4 KC2N2G4 12

2 2 3 1 KC2N3G1 11

2 2 3 2 KC2N3G2 17

2 2 3 3 KC2N3G3 14

2 2 3 4 KC2N3G4 12

3 1 1 1 KC1N1G1 10

3 1 1 2 KC1N1G2 18

3 1 1 3 KC1N1G3 9

3 1 1 4 KC1N1G4 12

3 1 2 1 KC1N2G1 12

3 1 2 2 KC1N2G2 17

3 1 2 3 KC1N2G3 14

3 1 2 4 KC1N2G4 15

3 1 3 1 KC1N3G1 11

3 1 3 2 KC1N3G2 18

3 1 3 3 KC1N3G3 10

3 1 3 4 KC1N3G4 12

3 2 1 1 KC2N1G1 9

3 2 1 2 KC2N1G2 19

3 2 1 3 KC2N1G3 15

3 2 1 4 KC2N1G4 11

3 2 2 1 KC2N2G1 14

3 2 2 2 KC2N2G2 16

3 2 2 3 KC2N2G3 16

3 2 2 4 KC2N2G4 18

3 2 3 1 KC2N3G1 15

3 2 3 2 KC2N3G2 18

3 2 3 3 KC2N3G3 15

3 2 3 4 KC2N3G4 13

;proc glm; class khoi kcach luongN giong; model y = khoi luongN luongN*khoi giong giong*luongN khoi*luongN*giong kcach khoi*kcach luongN*kcach khoi*luongN*kcach kcach*giong kcach*luongN*giong/ss3; test h=luongN e=khoi*luongN; test h=giong luongN*giong e=khoi*luongN*giong; test h=kcach e=khoi*kcach;

19

Page 20: Bài Tập Phân Tích Thống Kê Sinh Học Khoa Học Cây Trồng Với SAS

test h=luongN*kcach e=khoi*luongN*kcach; means luongN giong kcach giong*luongN/ lsd; lsmeans kcach*giong / pdiff=control adjust=dunnett; Title ‘ Nang suat cai be xanh (tan/ha) strip split plot’; run;

;proc glm; class khoi kcNgiong; model y = khoi kcNgiong/ss3; means kcNgiong / duncan alpha=0.05; run; /* Chương 4

PHÂN TÍCH PHƯƠNG SAI THÍ NGHIỆM MẠNG LƯỚI (LATTICE)

4.1. Áp dụng kiểu mạng lưới

Đây là kiểu bố trí áp dụng cho số lượng nghiệm thức nhiều và không thể bố trí theo khối đầy đủ ngẫu nhiên RCBD. Thí dụ trong nhà lưới chiều rộng luống hạn chế để bố trí chậu thành khối. Ngoài đồng ruộng không đủ đất đồng đều hay đất hẹp để bố trí nghiệm thức. Kiểu lattice tính phương sai và hiệp phương sai đơn giản.

Có 3 dạng chính là: mạng lưới ô vuông cân đối (balanced square lattices), mạng lưới ô vuông cân đối một phần (partially balanced square lattices) và mạng lưới chữ nhật (rectangular lattices). Bảng xếp hạng nghiệm thức được trình bày và so sánh với kiểu RCBD. Phương thức xử lý là Proc lacttice. Cách bố trí chỉ có nghiệm thức lặp lại 1 lần cạnh nhau, do đó tăng độ chính xác. Kết quả trung bình được điều chỉnh để so sánh giá trị cao nhất. Cách bố trí thí nghiệm theo qui định phức tạp, với dạng bố trí khối không đầy đủ cân đối (Balanced Incomplete Block, BIB), thường phải theo đúng mẫu, độ chính xác không bằng nhau khi so sánh các trung bình. Thí nghiệm có: t nghiệm thức, b khối, k đơn vị thí nghiệm hay ô trong khối (k < t) để mỗi nghiệm thức t xuất hiện 1 lần trong r các khối và mỗi cặp nghiệm thức xuất hiện với nhau trong λ khối. Công thức được áp dụng là t x r = b x k và λ(t-1) = r(k -1) theo Clewer (2001).

4.2. Thí nghiệm mạng lưới ô vuông cân đối (balanced square lattices)

Thí nghiệm với số nghiệm thức bằng bình phương số khối: t = k2, hay là số khối bằng căn bậc hai của số nghiệm thức: k = √t. Nếu t = 9, thì k = 3. Nếu k = 3 thì t = 9. Số lần lặp lại là r = k +1 = 4. Mỗi lần lặp lại có k khối, mỗi khối chứa k nghiệm thức. Số khối b = k x r = 12 = λ (k + 1). Do đó t x r = b x k = 36 = tổng số số mẫu quan sát. Khi đó mỗi cặp nghiệm thức xuất hiện 1 lần trong khối với λ = [r(k -1)]/ (t-1) = [4(3 -1)]/ (9-1) = 1.

Sơ đồ bố trí cân bằng hai chiều như sau:

Khối Lặp lại 1 Lặp lại 2 Lặp lại 3 Lặp lại 4

20

Page 21: Bài Tập Phân Tích Thống Kê Sinh Học Khoa Học Cây Trồng Với SAS

(1) 1 2 3 (4) 1 4 7 (7) 1 5 9 (10) 1 8 6(2) 4 5 6 (5) 2 5 8 (8) 7 2 6 (11) 4 2 9(3) 7 8 9 (6) 3 6 9 (9) 4 8 3 (12) 7 5 3

Bài tập khảo sát năng suất của 9 giống đậu phụng ở ẩm độ hạt 9%. Lưu ý nhập số liệu xem các nghiệm thức bố trí như sơ đồ trên.

Các biến phải được ghi theo tên là Group, Block, Treatmnt, và Rep.

Thí nghiệm này có 9 Treatmnt (nghiệm thức) là 9 giống. Bố trí theo Block (khối) 1, 2, 3. Group (nhóm) 1 đến 4 chỉ lần lặp lại trên cơ sở đơn vị ô thí nghiệm. Thí nghiệm này không có Rep (không có lặp lại). Biến đáp ứng là Nangsuat (năng suất).

Bài tập mẫu 12: */

Title 'So sanh nang suat dau phung kieu lattice'; Data Dphung; input Group Block Treatmnt Nangsuat @@; datalines; 1 1 1 2.10 1 1 2 1.54 1 1 3 2.28 1 2 4 2.15 1 2 5 0.95 1 2 6 1.66 1 3 7 1.73 1 3 8 1.60 1 3 9 1.46 2 1 1 1.22 2 1 4 1.32 2 1 7 1.25 2 2 2 2.12 2 2 5 1.17 2 2 8 1.43 2 3 3 2.06 2 3 6 2.24 2 3 9 1.36 3 1 1 1.72 3 1 5 1.25 3 1 9 1.14 3 2 2 1.56 3 2 6 2.20 3 2 7 1.85 3 3 3 1.61 3 3 4 1.56 3 3 8 1.43 4 1 1 1.67 4 1 6 1.58 4 1 8 1.35 4 2 2 1.45 4 2 4 1.62 4 2 9 1.48 4 3 3 2.03 4 3 5 0.95 4 3 7 1.83 ; proc lattice data= Dphung; var Nangsuat; run;

/* Chương 5

PHÂN TÍCH TƯƠNG TÁC (Interaction) VÀ TỔNG HỢP (Mixed Effect)

5.1. Phân tích tương tác (Interaction)

Các nghiệm thức trong thí nghiệm có ảnh hưởng với nhau làm cho hiệu quả sử dụng có thể cao hơn hoặc thấp hơn. Trong trường hợp sử dụng các loại thuốc, biểu hiện tương tác rõ đối với đối tượng được sử dụng. Giá trị trung bình bình phương nhỏ nhất (LS-Means) được dùng để so sánh tương tác thuốc và tương tác của thuốc*bệnh với lệnh xử lý proc GLM (General Linear Model).

Tương tác loại thuốc theo bài tập xử lý ANOVA hai chiều không cân đối có tương tác, với 6 lần lặp lại. Lưu ý dấu “.” trong các ô nhỏ là các ô thiếu giá trị số liệu.

21

Page 22: Bài Tập Phân Tích Thống Kê Sinh Học Khoa Học Cây Trồng Với SAS

Bài tập mẫu 13: */

title 'Phan tich phuong sai 2 chieu khong can doi'; data; input Thuoc $ Benh $ y @@; datalines;

1 1 44 1 1 41 1 1 35 1 1 12 1 1 18 1 1 211 2 31 1 2 3 1 2 27 1 2 4 1 2 32 1 2 221 3 30 1 3 3 1 3 6 1 3 24 1 3 25 1 3 242 1 27 2 1 1 2 1 23 2 1 34 2 1 42 2 1 132 2 11 2 2 34 2 2 33 2 2 31 2 2 3 2 2 362 3 3 2 3 26 2 3 27 2 3 32 2 3 4 2 3 163 1 3 3 1 12 3 1 . 3 1 27 3 1 2 3 1 193 2 4 3 2 11 3 2 9 3 2 7 3 2 1 3 2 63 3 20 3 3 1 3 3 2 3 3 12 3 3 3 3 3 34 1 25 4 1 4 4 1 9 4 1 22 4 1 2 4 1 164 2 26 4 2 12 4 2 12 4 2 5 4 2 14 4 2 174 3 23 4 3 7 4 3 24 4 3 5 4 3 12 4 3 .

; proc glm; class Thuoc Benh; model y=Thuoc Benh Thuoc*Benh/ ss1 ss2 ss3 ss4; run; lsmeans Thuoc / pdiff=all adjust=tukey; TITLE ‘TUONG TAC 3 LOAI THUOC’;

run;

/* 5.2. Phân tích ảnh hưởng tương tác kiểu lô phụ

Sử dụng proc mixed phân tích với kết quả rõ nhất là thí nghiệm lô phụ và xác định ảnh hưởng riêng biệt từng yếu tố. Thí nghiệm dùng giống và biện pháp xử lý lô hạt ảnh hưởng tỉ lệ nảy mầm hạt lúa. Ký hiệu: lô hạt giống (Lohat) gồm có AD1, X29, H67, B55; Khối (Khoi), cách xử lý (Xuly) gồm có nhiệt độ chu kỳ theo độ C 16 giờ/8 giờ (35/20doC), nhiệt độ ổn định (65doC), gibberellin (GA10ppm), nitric acid 5% (HNO3_.5%).

Bài tập mẫu 14: */

Data Lua;TITLE ‘TUONG TAC LO PHU’;

Input Lohat $ Khoi $ Xuly $ Tlnaymam;cards;AD1 1 35/20doC 48AD1 2 35/20doC 46.7AD1 3 35/20doC 34AD1 4 35/20doC 35.9X29 1 35/20doC 58.4X29 2 35/20doC 74.7

22

Page 23: Bài Tập Phân Tích Thống Kê Sinh Học Khoa Học Cây Trồng Với SAS

X29 3 35/20doC 50.5X29 4 35/20doC 40.2H67 1 35/20doC 67.4H67 2 35/20doC 63.6H67 3 35/20doC 49.7H67 4 35/20doC 55.4B55 1 35/20doC 80.5B55 2 35/20doC 75.7B55 3 35/20doC 59.1B55 4 35/20doC 57.8AD1 1 65doC 62.4AD1 2 65doC 67.1AD1 3 65doC 52.5AD1 4 65doC 54.9X29 1 65doC 66.2X29 2 65doC 78.2X29 3 65doC 51X29 4 65doC 60.5H67 1 65doC 72H67 2 65doC 59H67 3 65doC 53.6H67 4 65doC 55.3B55 1 65doC 74.9B55 2 65doC 75.9B55 3 65doC 66.2B55 4 65doC 67.1AD1 1 GA10ppm 54.7AD1 2 GA10ppm 59AD1 3 GA10ppm 45.9AD1 4 GA10ppm 44.6X29 1 GA10ppm 65X29 2 GA10ppm 71X29 3 GA10ppm 46.6X29 4 GA10ppm 50.1H67 1 GA10ppm 69.7H67 2 GA10ppm 51.3H67 3 GA10ppm 67.8H67 4 GA10ppm 55.5B55 1 GA10ppm 74B55 2 GA10ppm 70.5B55 3 GA10ppm 50.8B55 4 GA10ppm 56.2AD1 1 HNO3_.5% 50AD1 2 HNO3_.5% 47.4AD1 3 HNO3_.5% 33.9AD1 4 HNO3_.5% 40.3X29 1 HNO3_.5% 63.7X29 2 HNO3_.5% 63X29 3 HNO3_.5% 49.7X29 4 HNO3_.5% 57.2H67 1 HNO3_.5% 69.2H67 2 HNO3_.5% 61.0H67 3 HNO3_.5% 58.3

23

Page 24: Bài Tập Phân Tích Thống Kê Sinh Học Khoa Học Cây Trồng Với SAS

H67 4 HNO3_.5% 57.4B55 1 HNO3_.5% 77.2B55 2 HNO3_.5% 75B55 3 HNO3_.5% 62.2B55 4 HNO3_.5% 53;Proc Mixed method=type3;Classes Lohat Khoi Xuly;Model Tlnaymam = Lohat Xuly Lohat*Xuly;Random Khoi Lohat*Khoi;Lsmeans Lohat Xuly;Lsmeans Lohat*Xuly / slice=Lohat;Lsmeans Lohat*Xuly / slice= Xuly;Quit;

/* áp dụng method=type3 là chỉ sử dụng ANOVA loại 3, slice=Lohat là khảo sát tương tác riêng nhóm lô hạt so với tổng thể . */

/* Chương 6 THỐNG KÊ MÔ TẢ, TƯƠNG QUAN VÀ HỒI QUI

6.1. Tính giá trị trung bình và độ lệch chuẩnBài tập chủ đề: thống kê mô tả tính giá trị trung bình (MEAN) và độ lệch chuẩn (SD, STD, standard deviation) của thí nghiệm khối đầy đủ ngẫu nhiên, ba khối của 13 giống cỏ ký hiệu số như là 4405, 4366. Khảo sát ba chỉ tiêu là tỉ lệ nảy mầm % (TLNMAM), điểm cường lực (vigor, CLUC) và điểm khả năng sản xuất hạt (SXHAT). Lưu ý: K là khối, giá trị này chỉ ghi theo khối, không dùng phân tích mô tả (số liệu trích từ NRCS, 2007).

Bài tập mẫu 15: */

data A;input K GIONG $ TLNMAM CLUC SXHAT; cards;

1 4405 39 6 6

1 4366 100 7 6

1 4356 90 6 5

1 4414 100 5 5

1 2275 56 7 5

1 4386 100 7 6

1 4432 98 5 6

1 4361 100 5 4

1 4365 75 7 5

1 4456 100 4 5

1 4430 88 6 6

1 4376 100 5 6

1 1261 100 6 7

2 4405 56 5 6

2 4366 98 7 5

2 4356 100 5 7

2 4414 100 6 6

2 2275 89 4 4

2 4386 98 7 6

24

Page 25: Bài Tập Phân Tích Thống Kê Sinh Học Khoa Học Cây Trồng Với SAS

2 4432 89 8 8

2 4361 100 4 5

2 4365 85 5 7

2 4456 95 5 3

2 4430 90 6 5

2 4376 100 9 4

2 1261 100 7 6

3 4405 65 6 4

3 4366 90 5 5

3 4356 100 4 6

3 4414 100 8 4

3 2275 85 7 5

3 4386 93 6 3

3 4432 88 4 5

3 4361 100 4 6

3 4365 88 8 7

3 4456 100 8 4

3 4430 93 5 7

3 4376 100 5 8

3 1261 98 6 9; proc sort; by GIONG; proc means data=A noprint; var TLNMAM CLUC SXHAT; by GIONG; output out=newA; proc print data=newA; TITLE ‘THONG KE MO TA’;

run;

/* 6.2. Chi-bình phương (Chi-square) so sánh tính độc lập của hai yếu tố Trắc nghiệm tính độc lập căn cứ vào vấn đề đặt ra là giả thiết H0 là các biện pháp áp dụng đều có ảnh hưởng như nhau. Sử dụng xác suất của Chi-bình phương để tính, nếu p < 0,05 là bác bỏ giả thiết trên, kỹ thuật áp dụng có ảnh hưởng, nếu p > 0,05 thì chấp nhận giả thiết trên, kỹ thuật áp dụng như nhau. Thường áp dụng cho các biện pháp kỹ thuật để xác định ảnh hưởng đến sinh trưởng của cây, cây bệnh hay không bệnh căn cứ trên tần số xuất hiện (Frequency, F). Công thức tính Chi-bình phương = ∑(F – E)2/E, trong đó tần số ước định (Expected) E = (Tổng hàng x Tổng cột)/Tổng số chung.

Điều tra sau phun thuốc ảnh hưởng sinh trưởng cây với hai yếu tố là: (1) phun thuốc và không phun, (2) cây tốt và cây bệnh. Số lượng cây được đếm trong tổng số 1000 cây. Giả thiết H0 là chấp nhận phun thuốc và cây bệnh không ảnh hưởng nhau.

Bài tập mẫu 16: */

data Dieutra; input Xitthuoc $ Struong $ Soluong @@; datalines;phun benh 10

25

Page 26: Bài Tập Phân Tích Thống Kê Sinh Học Khoa Học Cây Trồng Với SAS

phun tot 190khong benh 96khong tot 704;proc freq data=Dieutra order=data; weight Soluong; tables Xitthuoc*Struong / chisq expected cellchi2 norow nocol; output out=ChiSqData pchi lrchi n nmiss; title 'Chi-Square Tests Xitthuoc'; run;

/* 6.3. T test: so sánh khác biệt trung bình hai mẫu Áp dụng trong trường hợp điều tra chọn mẫu hai lô đối chứng và tác động kỹ thuật như phun thuốc tăng nở hoa, đậu quả, bón phân và không bón, xịt thuốc diệt cỏ và không xịt thuốc. So sánh hai giá trị trung bình của hai biến, cũng căn cứ trên xác suất p. Nếu p > 0,05 thì hai biến số không khác nhau có nghĩa. Áp dụng cho chọn mẫu có số điểm chọn bằng nhau. Nếu bố trí các ô theo dõi ở vị trí giống nhau của hai nhóm mẫu, gọi là bắt cặp (paired comparison), nếu bố trí các ô theo dõi ở vị trí khác nhau của hai mẫu, gọi là không bắt cặp (unpaired comparison).

Thí nghiệm sử dụng chất điều hòa sinh trưởng Z cho giống cải dầu (B) và giống đối chứng (A) không xử lý, kết quả năng suất (tấn/ha) như sau (số liệu trích từ Clewer, 2001):

Bài tập mẫu 17: */ data; title 'SO SANH T TEST'; input S A B; diff=B-A; cards;

1 3.5 5.5

24.6 4.1

34.0 4.5

44.3 6.1

54.0 4.6

64.6 5.3

7 5.0 5.48 3.9 3.99 3.5 4.410

4.8 6.1

; proc means mean stderr t prt; var diff; run;

26

Page 27: Bài Tập Phân Tích Thống Kê Sinh Học Khoa Học Cây Trồng Với SAS

/* 6.4. Tính ma trận tương quan (correlation matrix) Xác định ma trận tương quan hai chiều các biến số đồng nhất áp dụng đối với năng suất cây là tìm yếu tố nào ảnh hưởng lớn nhất đến năng suất cây, từ đó đề xuất biện pháp cải thiện năng suất hợp lý. Lưu ý sử dụng giá trị hệ số tương quan r và xác suất p. Với số cặp mẫu n = 12, nếu r > 0,7 là tương quan chặt, nếu p < 0,05 thì kết luận có khác biệt giữa hai biến số. Nếu p > 0,05 thì hai biến số không khác nhau có nghĩa.Khảo sát tương quan năng suất cây cà phê (kg/cây), ký hiệu là NSUATCAY với tỉ lệ hạt tròn (%) (HATTRON), tỉ lệ nhân/quả (%) (NHANQUA), cấp hạt R1 (%) là tỉ lệ hạt được giữ lại trên sàng rây 6,3 mm và trọng lượng 100 quả (g) (TL100QUA). Tương quan này được khảo sát từ thí nghiệm bón phân đạm kết hợp thạch cao.

Bài tập mẫu 18: */ DATA; TITLE ‘MA TRAN TUONG QUAN’;INPUT NSUATCAY HATTRON NHANQUA R1 TL100QUA; CARDS;

1.83 22.8 15.6 40.8 103.71.82 18.0 16.2 41.3 112.61.82 21.1 15.7 42.4 106.61.83 20.9 15.5 41.2 105.91.84 14.9 16.6 43.7 112.51.86 12.8 16.9 44.9 124.41.90 12.8 17.1 42.4 118.61.93 11.9 17 69.6 134.21.85 12.4 17.2 43.9 118.61.96 11.9 17.2 70.7 128.72.08 11.5 17.4 80.4 142.32.01 12.5 17.0 70.4 134.6

;PROC CORR OUTP=P; RUN; PROC PRINT DATA=P;

RUN;

/* 6.5. Hồi qui tuyến tính đơn biến (simple regression) Xác định phương trình y = ax + b của hai chỉ tiêu thể hiện với phương trình hồi qui có nghĩa. Khảo sát phương trình hồi qui của trọng lượng khô X g (TLKHO) và diện tích lá Y cm2 (DTLA) của cây cỏ thức ăn gia súc do bón phân như sau (số liệu trích từ Clewer, 2001):

Bài tập mẫu 19: */

DATA A; title 'hoi qui tuyen tinh'; INPUT TLKHO DTLA; CARDS;

27

Page 28: Bài Tập Phân Tích Thống Kê Sinh Học Khoa Học Cây Trồng Với SAS

0.29 1440.43 1800.21 600.53 2260.27 1050.33 1110.47 2170.40 2210.48 2180.30 1370.37 1530.30 105; PROC REG DATA=A; MODEL DTLA = TLKHO; RUN; symbol1 c=blue i=none v=dot;

PLOT DTLA*TLKHO/cframe=white; RUN;

/* 6.6. Hồi qui bậc hai, xác định đường biểu diễn

Thí nghiệm áp dụng lượng đạm N ảnh hưởng đến năng suất hạt rau húng quế

Bài tập mẫu 1: */

title 'Anh huong luong N den nang suat hat rau hung que (tan/ha)’;data nangsuat; input luongN nsuat @@; datalines; 0 0.15 50 0.32 100 0.64 150 0.72 200 1.35 250 1.05 300 0.91350 0.80 ; proc rsreg data= nangsuat; model nsuat=luongN /lackfit; run; proc glm; model nsuat=luongN luongN*luongN / p clm; output out=pp p=nsuatpred r=resid; axis1 minor=none major=(number=5); axis2 minor=none major=(number=8); symbol1 c=blue i=none v=dot; symbol2 c=red i=spline v=none; proc gplot data=pp; plot nsuat*luongN=1 nsuatpred*luongN=2 / overlay haxis=axis1 vaxis=axis2; run;

28

Page 29: Bài Tập Phân Tích Thống Kê Sinh Học Khoa Học Cây Trồng Với SAS

/* 6.7. Đường biểu diễn ba chiều

Bài tập mẫu 20: */ data measure; input Potassium Nitrogen Nangsuat @@; lines;

50 30 114050 60 277650 90 178670 30 202070 60 222470 90 280790 30 118690 60 203090 90 172450 30 191050 60 210050 90 127570 30 214270 60 290070 90 218590 30 90690 60 211190 90 187250 30 90550 60 205250 90 174170 30 290070 60 210070 90 270090 30 90090 60 270090 90 2100

; data measure1; set measure; run; proc sort data=measure1; by Nitrogen Potassium; run; data Measure1; set measure1; by Nitrogen Potassium; if last.Potassium then Potassium=Potassium+0.000001; run; data pred; do Potassium=50 to 90 by 1; do Nitrogen=30 to 90 by 1;

29

Page 30: Bài Tập Phân Tích Thống Kê Sinh Học Khoa Học Cây Trồng Với SAS

output; end; end; run; proc tpspline data=measure; model Nangsuat=(Potassium Nitrogen) / lognlambda=(-4 to -2 by 0.1); score data=pred out=preNangsuat; output out=estimate pred uclm lclm; title ' '; run; proc g3d data=preNangsuat; plot Nitrogen*Potassium=p_Nangsuat/grid zmin=0 zmax=3000 ctop=blue cbottom=yellow caxis=green zticknum=5xticknum=5yticknum=5;title 'Tuong quan nang suat hat dau phung (kg/ha) voi luong K va N (kg/ha)’; run;

/* Chương 7

PHÂN TÍCH SỐ LIỆU BẰNG ĐỒ THỊ

Số liệu được phân tích bằng đồ thị trong chương này thể hiện số liệu ở dạng biểu đồ xác định thành phần chính, mặt tương ứng đa biến, đồ thị thành phần chất lượng chính, sơ đồ cây phả hệ. 7.1. Phân tích thành phần chính (Principal component analysis)

Phân tích thành phần chính có thể sử dụng số liệu thô, ma trận tương quan, ma trận hiệp phương sai, tổng bình phương. Thành phần chính thứ nhất có biến lượng lớn nhất, sau đó thành phần chính cuối cùng có biến lượng nhỏ nhất của kết hợp tuyến tính với các biến ban đầu.Bài tập về thống kê nhiệt độ trung bình tháng 1 và tháng 7 ở một số vùng trồng cà phê Việt Nam, so với nhiệt độ thích hợp cho cà phê Arabica và Robusta.

Bài tập mẫu 21: */

Data Nhietdo; title 'Nhiet do trung binh thang 1 va thang 7 mot so tinh trong ca phe'; input Tinh $1-15 Thang1 Thang7; datalines;Lam Dong 18.0 24.0Gia Lai 19.0 27.0Dak Lak 20.0 26.0Quang Tri 18.0 27.0Binh Phuoc 24.0 27.0Dong Nai 25.0 27.0

30

Page 31: Bài Tập Phân Tích Thống Kê Sinh Học Khoa Học Cây Trồng Với SAS

Son La 17.0 26.0Nghe An 20.0 26.0ARABICA 18.0 23.0ROBUSTA 20.0 30.0;title2 'Do thi nhiet do (do C)';%plotit(data=Nhietdo, labelvar=Tinh, plotvars=Thang7 Thang1, color=black, colors=blue);run;

proc princomp data=Nhietdo cov out=Prin;title2;var Thang7 Thang1;run;title2 'Cac diem cua Principal Components';%plotit(data=Prin, labelvar=Tinh, plotvars=Prin2 Prin1, color=black, colors=blue);run;

/* 7.2. Phương pháp so sánh hệ số tương đồng và khác biệt

Các sự hiện diện của yếu tố được thể hiện theo định lượng bằng số thập phân; định tính như có hay không được mã hóa bằng số, nếu xác định là có ký hiệu là 1, và không có ký hiệu là 0. Các yếu tố này áp dụng cho sự phân tích các yếu tố xã hội, nghiên cứu sinh học, di truyền (SAS, 2004).

7.2.1. Xác định khác biệt khoảng cách các chỉ tiêu định lượng theo hệ số Euclid:Sử dụng phương pháp tính khác biệt khoảng cách theo phương pháp trung bình số học (UPGMA) các chỉ tiêu định lượng.

So sánh khoảng cách khác biệt Euclid của 10 giống khảo sát là A, B, C …..J với 5 chỉ tiêu từ ct1 đến ct5. Xử lý distance theo bảng lập trình như sau:

Bài tập mẫu 22: */

data caytrong; input Giong $ ct1 ct2 ct3 ct4 ct5; cards;

A 8 5 11 10 11B 7 6 13 18 6C 9 3 12 22 12D 13 3 9 8 10E 6 7 8 7 10F 12 10 18 17 19G 9 5 17 18 13H 7 7 21 26 13I 11 5 22 24 19J 6 7 13 18 14; proc distance data= caytrong out=Dist method=Euclid;

31

Page 32: Bài Tập Phân Tích Thống Kê Sinh Học Khoa Học Cây Trồng Với SAS

var interval(ct1--ct5 / std=Std); id Giong; run; proc print data=Dist(obs=10); title 'So sanh UPGMA 10 giong xu ly PROC DISTANCE'; run; proc cluster data= Dist method=average rsq pseudo outtree=Tree; id Giong; run; axis1 order=(0 to 1 by 0.1); proc tree data=Tree haxis=axis1 horizontal lines= (color=green) lines= (width=2); height _rsq_; id Giong; run;

/* 7.2.1. Xác định các chỉ tiêu số liệu nhị phân theo hệ số Dice:Sử dụng phương pháp tính khác biệt khoảng cách theo phương pháp trung bình số học (UPGMA)

Bài tập mẫu 23: */

data caytrong; title 'Khoang cach Dice'; input giong $ p1 p2 p3 p4 p5 p6 p7 p8 p9 p10 p11 p12 p13 p14 p15 p16 p17 p18 p19 p20 p21 p22 p23 p24 p25 p26 p27 p28 p29 p30 p31 p32 p33 p34 p35 p36 p37 p38 p39 p40 p41 p42 p43 p44 p45 p46 p47 p48 p49 p50 p51 p52 p53 p54 p55 p56 p57 p58 p59 p60 p61 p62 p63; datalines;A1 1 0 0 1 0 1 0 0 1 1 0 0 0

0 1 1 0 0 1 1 0 0 0 1 0 10 1 1 1 1 1 0 1 1 1 0 1 00 0 1 0 1 1 0 1 1 1 1 1 10 1 1 1 1 1 1 1 1 0 0

B2 1 0 1 0 0 1 1 1 1 1 0 0 11 1 1 1 1 1 1 0 1 0 1 0 10 0 1 0 1 1 1 1 1 1 1 1 00 0 1 0 0 1 1 0 1 1 1 1 11 1 1 1 1 1 1 1 1 0 0

C3 1 0 0 1 0 1 0 0 1 1 0 0 00 1 1 0 0 1 1 0 0 0 1 1 10 1 0 1 1 1 0 1 1 1 1 1 01 0 1 0 0 1 0 1 1 1 1 1 10 1 1 0 1 0 1 1 1 0 0

D4 1 1 0 0 0 1 0 0 1 1 0 1 11 0 1 0 0 1 1 0 0 1 1 0 10 0 1 1 1 1 1 0 1 1 0 0 00 0 0 0 1 1 1 1 1 1 1 1 10 1 1 0 1 1 1 1 0 0 1

E5 1 0 1 0 0 1 1 0 1 1 1 0 00 1 1 0 0 1 1 1 0 1 1 1 11 0 1 0 1 1 1 1 1 1 0 0 10 0 0 0 1 1 0 1 1 1 1 0 00 1 1 1 1 1 1 1 1 0 0

32

Page 33: Bài Tập Phân Tích Thống Kê Sinh Học Khoa Học Cây Trồng Với SAS

F6 0 1 0 0 0 1 0 1 0 1 0 0 11 1 1 0 1 1 1 1 0 0 1 0 10 0 0 0 1 0 1 1 1 1 0 0 10 1 0 0 1 1 1 1 1 1 1 0 10 0 1 0 1 0 0 1 0 1 0

G7 1 0 0 1 0 1 0 0 1 1 0 0 11 1 1 1 1 1 1 1 0 0 1 1 10 0 1 1 1 0 1 1 1 0 1 1 01 1 1 0 0 1 1 0 1 1 1 0 10 1 1 0 0 1 1 1 1 0 1

H8 0 1 0 1 0 1 1 1 1 1 1 0 10 0 1 1 1 1 0 1 0 0 1 0 10 0 1 0 1 0 1 1 1 0 1 1 01 0 1 0 0 1 1 0 1 1 1 0 10 1 1 1 0 1 1 1 0 0 1

K9 1 0 1 0 1 1 1 1 1 1 0 0 11 0 1 1 1 1 1 0 0 1 1 1 10 0 1 1 1 1 1 1 1 1 0 0 10 1 1 1 1 1 1 0 1 1 1 0 00 1 1 1 1 1 1 1 1 0 0

;proc distance data=caytrong method=Dice absent=0 out=DistDice; var anominal (p1-p63); id giong; run; proc print data=distDice (obs=9); id giong; var A1--K9; run; title2;

proc cluster data= caytrong method=average rsq pseudo outtree=Tree; id giong; run; axis1 order=(0 to 1 by 0.1); proc tree data=Tree haxis=axis1 horizontal lines= (color=green) lines= (width=2); height _rsq_;run;

33