161
i MC LC MC LC ............................................................................................................................................. I LI NI —U....................................................................................................................................... 1 CĂN BN .............................................................................................................................................. 3 Thng kŒ l g? ................................................................................................................................... 3 Dn sv mu .................................................................................................................................... 3 XÆc định dn s.................................................................................................................................. 4 Phn tch sliu v trnh by kết qu................................................................................................. 4 Chn mÆy tnh cm tay ....................................................................................................................... 5 TN SUT, PH´N PHI TN SUT V TCHC —............................................................. 6 Gii thiu ........................................................................................................................................... 6 Tn sut (sliu định tnh) ................................................................................................................. 6 Phn phi tn sut (sliu định lượng) .............................................................................................. 6 Tchc đồ ......................................................................................................................................... 8 —a giÆc tn sut .................................................................................................................................. 9 Phn phi tn sut ca dn s............................................................................................................. 9 Hnh dng ca phn phi tn sut..................................................................................................... 10 TRUNG BNH, —LCH CHUN V SAI SCHUN............................................................. 11 Gii thiu ......................................................................................................................................... 11 Trung bnh, trung vv yếu v.......................................................................................................... 11 Sđo sbiến thiŒn ........................................................................................................................... 11 Tnh toÆn trung bnh v độ lch chun tphn phi tn sut ........................................................... 13 Thay đổi đơn v................................................................................................................................ 14 Sai sly mu v sai schun ......................................................................................................... 14 PH´N PHI BNH THƯỜNG ......................................................................................................... 16 Gii thiu ......................................................................................................................................... 16 Phn phi bnh thường chun ........................................................................................................... 16 Bng tnh din tch dưới đường cong ca phn phi bnh thường .................................................... 17 CÆc đim phn trăm ca phn phi bnh thường .............................................................................. 19 KHONG TIN CY CA TRUNG BNH ...................................................................................... 21 Gii thiu ......................................................................................................................................... 21 Trường hp mu cln (phn phi bnh thường) ............................................................................ 21 Mu nh........................................................................................................................................... 22 Khong tin cy døng phn phi t ...................................................................................................... 22 Tm tt cÆc trường hp .................................................................................................................... 23 KIM —NH NGHĨA CA MT TRUNG BNH....................................................................... 26 Gii thiu ......................................................................................................................................... 26 Kim định t cp đi .......................................................................................................................... 26 Quan hgia khong tin cy v kim định nghĩa .......................................................................... 28 Kim định nghĩa 1 đui v 2 đui ................................................................................................. 28 Kim định t mt mu ........................................................................................................................ 29 Kim định bnh thường..................................................................................................................... 29 CÆc loi sai lm trong kim định githuyết ..................................................................................... 30 SO S`NH HAI TRUNG BNH.......................................................................................................... 32 Gii thiu ......................................................................................................................................... 32 Phn phi ly mu ca hiu shai trung bnh .................................................................................. 32 Kim định bnh thường (mu ln hay biết độ lch chun)................................................................ 32 Kim định t (mu nh, độ lch chun bng nhau) ............................................................................ 33 Cmu nh, độ lch chun khng bng nhau .................................................................................. 35 SO S`NH NHIU TRUNG BNH - PH´N T˝CH PHƯƠNG SAI ................................................ 36 Gii thiu ......................................................................................................................................... 36

MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

  • Upload
    others

  • View
    5

  • Download
    0

Embed Size (px)

Citation preview

Page 1: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

i

MỤC LỤC MỤC LỤC............................................................................................................................................. I LỜI NÓI ÐẦU.......................................................................................................................................1 CĂN BẢN.............................................................................................................................................. 3

Thống kê là gì?................................................................................................................................... 3 Dân số và mẫu.................................................................................................................................... 3 Xác định dân số .................................................................................................................................. 4 Phân tích số liệu và trình bày kết quả ................................................................................................. 4 Chọn máy tính cầm tay....................................................................................................................... 5

TẦN SUẤT, PHÂN PHỐI TẦN SUẤT VÀ TỔ CHỨC ÐỒ ............................................................. 6 Giới thiệu ........................................................................................................................................... 6 Tần suất (số liệu định tính)................................................................................................................. 6 Phân phối tần suất (số liệu định lượng) .............................................................................................. 6 Tổ chức đồ ......................................................................................................................................... 8 Ða giác tần suất .................................................................................................................................. 9 Phân phối tần suất của dân số............................................................................................................. 9 Hình dạng của phân phối tần suất.....................................................................................................10

TRUNG BÌNH, ÐỘ LỆCH CHUẨN VÀ SAI SỐ CHUẨN.............................................................11 Giới thiệu .........................................................................................................................................11 Trung bình, trung vị và yếu vị ..........................................................................................................11 Số đo sự biến thiên...........................................................................................................................11 Tính toán trung bình và độ lệch chuẩn từ phân phối tần suất ...........................................................13 Thay đổi đơn vị ................................................................................................................................14 Sai số lấy mẫu và sai số chuẩn .........................................................................................................14

PHÂN PHỐI BÌNH THƯỜNG .........................................................................................................16 Giới thiệu .........................................................................................................................................16 Phân phối bình thường chuẩn...........................................................................................................16 Bảng tính diện tích dưới đường cong của phân phối bình thường....................................................17 Các điểm phần trăm của phân phối bình thường ..............................................................................19

KHOẢNG TIN CẬY CỦA TRUNG BÌNH ...................................................................................... 21 Giới thiệu ......................................................................................................................................... 21 Trường hợp mẫu cỡ lớn (phân phối bình thường) ............................................................................ 21 Mẫu nhỏ ........................................................................................................................................... 22 Khoảng tin cậy dùng phân phối t...................................................................................................... 22 Tóm tắt các trường hợp .................................................................................................................... 23

KIỂM ÐỊNH Ý NGHĨA CỦA MỘT TRUNG BÌNH....................................................................... 26 Giới thiệu ......................................................................................................................................... 26 Kiểm định t cặp đôi .......................................................................................................................... 26 Quan hệ giữa khoảng tin cậy và kiểm định ý nghĩa .......................................................................... 28 Kiểm định ý nghĩa 1 đuôi và 2 đuôi ................................................................................................. 28 Kiểm định t một mẫu........................................................................................................................ 29 Kiểm định bình thường..................................................................................................................... 29 Các loại sai lầm trong kiểm định giả thuyết ..................................................................................... 30

SO SÁNH HAI TRUNG BÌNH.......................................................................................................... 32 Giới thiệu ......................................................................................................................................... 32 Phân phối lấy mẫu của hiệu số hai trung bình .................................................................................. 32 Kiểm định bình thường (mẫu lớn hay biết độ lệch chuẩn)................................................................ 32 Kiểm định t (mẫu nhỏ, độ lệch chuẩn bằng nhau) ............................................................................ 33 Cỡ mẫu nhỏ, độ lệch chuẩn không bằng nhau .................................................................................. 35

SO SÁNH NHIỀU TRUNG BÌNH - PHÂN TÍCH PHƯƠNG SAI ................................................ 36 Giới thiệu ......................................................................................................................................... 36

Page 2: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

ii

Phân tích phương sai một chiều........................................................................................................ 37 Phân tích phương sai hai chiều......................................................................................................... 39 Quy hoạch cân đối có lặp ................................................................................................................. 40 Quy hoạch cân đối không lặp ........................................................................................................... 40 Quy hoạch không cân đối ................................................................................................................. 42 Tác động cố định và ngẫu nhiên....................................................................................................... 43

TƯƠNG QUAN VÀ HỒI QUY TUYẾN TÍNH ............................................................................... 45 Giới thiệu ......................................................................................................................................... 45 Tương quan ...................................................................................................................................... 45 Hồi quy tuyến tính............................................................................................................................ 47 Sử dụng máy tính cầm tay ................................................................................................................ 50

HỒI QUY BỘI .................................................................................................................................... 51 Giới thiệu ......................................................................................................................................... 51 Phương pháp phân tích phương sai dùng cho hồi quy tuyến tính đơn .............................................. 51 Quan hệ giữa hệ số tương quan và bảng phân tích phương sai......................................................... 52 Hồi quy bội với 2 biến số ................................................................................................................. 52 Hồi quy bội với nhiều biến............................................................................................................... 53 Hồi quy bội với các biến giải thích rời rạc ....................................................................................... 54 Hồi quy bội với các biến giải thích phi tuyến tính............................................................................ 54 Quan hệ giữa hồi quy bội và phân tích phương sai........................................................................... 55 Phân tích đa biến .............................................................................................................................. 55

XÁC SUẤT.......................................................................................................................................... 56 Giới thiệu ......................................................................................................................................... 56 Tính toán xác suất ............................................................................................................................ 56 Quy tắc nhân..................................................................................................................................... 56 Quy tắc cộng .................................................................................................................................... 57

TỈ LỆ ................................................................................................................................................... 58 Giới thiệu ......................................................................................................................................... 58 Phân phối nhị thức............................................................................................................................ 58 Kiểm định ý nghĩa cho tỉ lệ đơn dùng phân phối nhị thức................................................................ 60 Xấp xỉ phân phối bình thường của phân phối nhị thức..................................................................... 63 Kiểm định ý nghĩa và khoảng tin cậy dùng xấp xỉ bình thường ....................................................... 63

KIỂM ÐỊNH CHI BÌNH PHƯƠNG CHO BẢNG DỰ TRÙ .......................................................... 67 Giới thiệu ......................................................................................................................................... 67 Bảng 2 × 2 (so sánh hai tỉ lệ)............................................................................................................ 67 Công thức ngắn gọn cho bảng 2 × c ................................................................................................ 71

BỔ SUNG MỘT SỐ PHƯƠNG PHÁP CHO BẢNG DỰ TRÙ ...................................................... 72 Giới thiệu ......................................................................................................................................... 72 Kiểm định chính xác cho bảng 2 × 2 ............................................................................................... 72 So sánh 2 tỉ lệ - trường hợp cặp đôi.................................................................................................. 73 Phân tích nhiều bảng 2 × 2 .............................................................................................................. 75 Kiểm định chi bình phương định hướng........................................................................................... 78 Kĩ thuật phức tạp hơn....................................................................................................................... 79

ÐO LƯỜNG BỆNH TẬT VÀ TỬ VONG ........................................................................................ 81 Giới thiệu ......................................................................................................................................... 81 Tỉ suất sinh và chết........................................................................................................................... 81 Ðo lường tử vong trong một nghiên cứu .......................................................................................... 82 Ðo lường tử vong ............................................................................................................................. 82 Tỉ suất chuẩn hóa ............................................................................................................................. 84 Phân tích tỉ suất ................................................................................................................................ 87

PHÂN TÍCH SỐNG CÒN.................................................................................................................. 88 Giới thiệu ......................................................................................................................................... 88 Bảng sống......................................................................................................................................... 88 So sánh các bảng sống...................................................................................................................... 90 Mô thức sống còn............................................................................................................................. 91

Page 3: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

iii

PHÂN PHỐI POISSON ..................................................................................................................... 92 Giới thiệu ......................................................................................................................................... 92 Ðịnh nghĩa........................................................................................................................................ 92 Hình dáng......................................................................................................................................... 93 Kết hợp số đếm ................................................................................................................................ 93 Phân phối Poisson và tỉ suất ............................................................................................................. 94 Phân tích tỉ suất mới mắc ................................................................................................................. 95

TÍNH PHÙ HỢP CỦA PHÂN PHỐI TẦN SUẤT........................................................................... 97 Giới thiệu ......................................................................................................................................... 97 Phù hợp theo phân phối bình thường................................................................................................ 97 Kiểm định phù hợp chi bình phương................................................................................................ 98

PHÉP BIẾN ÐỔI ..............................................................................................................................102 Giới thiệu .......................................................................................................................................102 Phép biến đổi logarithm .................................................................................................................102 Chọn phép biến đổi ........................................................................................................................106

PHƯƠNG PHÁP PHI THAM SỐ...................................................................................................108 Giới thiệu .......................................................................................................................................108 Kiểm định sắp hạng có dấu Wilcoxon............................................................................................109 Kiểm định tổng sắp hạng Wilcoxon ...............................................................................................110 Tương quan sắp hạng Spearman.....................................................................................................111

LẬP KẾ HOẠCH VÀ TIẾN HÀNH NGHIÊN CỨU ....................................................................113 Giới thiệu .......................................................................................................................................113 Mục tiêu của nghiên cứu ................................................................................................................113 Phân tích thống kê hộ tịch ..............................................................................................................113 Nghiên cứu quan sát .......................................................................................................................114 Nghiên cứu thực nghiệm ................................................................................................................115 Quy hoạch bản vấn lục ...................................................................................................................116 Kiểm tra số liệu ..............................................................................................................................117

NGUỒN GỐC SAI SỐ .....................................................................................................................118 Giới thiệu .......................................................................................................................................118 Sai số chọn lựa ...............................................................................................................................118 Sai lệch gây nhiễu...........................................................................................................................118 Sai lệch thông tin............................................................................................................................119 Ðộ nhậy cảm và độ đặc hiệu...........................................................................................................119 Hồi quy về trung bình.....................................................................................................................120

PHƯƠNG PHÁP LẤY MẪU...........................................................................................................123 Giới thiệu .......................................................................................................................................123 Chọn mẫu ngẫu nhiên đơn..............................................................................................................123 Chọn mẫu hệ thống.........................................................................................................................124 Các lược đồ lấy mẫu phức tạp hơn .................................................................................................124 Lấy mẫu phân tầng .........................................................................................................................125 Lấy mẫu nhiều bậc .........................................................................................................................125 Lấy mẫu cụm..................................................................................................................................126

NGHIÊN CỨU ÐOÀN HỆ VÀ BỆNH CHỨNG............................................................................127 Giới thiệu .......................................................................................................................................127 Nghiên cứu đoàn hệ........................................................................................................................127 Nguy cơ tương đối..........................................................................................................................127 Nguy cơ qui trách ...........................................................................................................................128 Nghiên cứu bệnh chứng..................................................................................................................132

THỬ NGHIỆM LÂM SÀNG VÀ NGHIÊN CỨU CAN THIỆP ..................................................136 Giới thiệu .......................................................................................................................................136 Thử nghiệm lâm sàng .....................................................................................................................136 Thử nghiệm vaccine .......................................................................................................................139 Nghiên cứu can thiệp......................................................................................................................140

Page 4: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

iv

TÍNH CỠ MẪU CẦN THIẾT .........................................................................................................141 Giới thiệu .......................................................................................................................................141 Nguyên lí của việc xác định cỡ mẫu...............................................................................................141 Công thức tính cỡ mẫu ...................................................................................................................143

SỬ DỤNG MÁY TÍNH ....................................................................................................................149 Giới thiệu .......................................................................................................................................149 Phần cứng máy tính ........................................................................................................................149 Ổ đĩa...............................................................................................................................................149 Tổ chức dữ liệu ..............................................................................................................................150 Sao chép lưu...................................................................................................................................150 Phần mềm máy tính ........................................................................................................................151

CHÈ MUÛC......................................................................................................................................152

Page 5: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

1

LỜI NÓI ÐẦU Mục đích của việc viết cuốn sách này là đưa những phương pháp thống kê y học đa dạng áp dụng trong nghiên cứu y khoa vào trong thực hành, và trong khi làm việc đó, tôi hi vọng là tôi đã kết hợp được sự đơn giản với tính sâu sắc. Tôi đã sử dụng một các sắp xếp các chủ đề khác hơn với hầu hết các sách giáo khoa khác, dựa trên tiến trình logic những khái niệm thực hành, hơn là dựa trên các bước phát triển của toán học hình thức. Ý tưởng thống kê được đưa vào khi cần thiết, và tất cả các phương pháp được mô tả trong bối cảnh của những ví dụ phù hợp được rút ra từ những tình huống thực sự. Có nhiều tham khảo qua lại để liên kết và đối chiếu những cách tiếp cận khác nhau có thể áp dụng trong những tình huống tương tự. Theo cách này, người đó sẽ được dẫn dắt mau hơn đến việc phân tích những vấn đề thực hành và sẽ dễ dàng nắm bắt được những thủ tục gì có thể được áp dụng khi nào.

Cuốn sách này là thích hợp để tự học, là bạn đồng hành cho những khóa giảng về thống kê y học hay là một tài liệu tham khảo. Nó bao gồm tất cả các chủ đề mà một nhà nghiên cứu y khoa hay một sinh viên có thể gặp phải. Một số những phương pháp cao cấp (hay hiếm) chỉ được mô tả ngắn gọn,và người đọc được đề nghị tham khảo những sách chuyên môn hơn. Dù vậy, chúng tôi hi vọng rằng, ít có trường hợp phải tìm kiếm một chủ đề trong chỉ mục và tìm không tìm được một lưu ý nào. Tất cả các công thức đề được nhấn mạnh một cách rõ ràng để dễ dàng tham khảo và có những tóm tắt hữu dụng của những phương pháp ở bìa sách.

Cuốn sách này là sự giới thiệu ngắn gọn và trực tiếp những phương pháp và ý tưởng cơ bản của thống kê y khoa. Dù vậy, nó không dừng ở đó. Nó có mục đích là một hướng dẫn viên toàn diện về chủ đề. Ðối với ai thực sự quan tâm đến áp dụng thống kê, sẽ là không đủ nếu chỉ có thể tiến hành, thí dụ như, kiểm định t. Nó cũng quan trọng để đánh giá những hạn chế của phương pháp đơn giản và biết chúng có thể được mở rộng khi nào và như thế nào. Vì lí do này, có những chương như phân tích phương sai và hồi quy đa biến đã được đưa vào. Khi giải quyết với những phương pháp cao cấp, giải pháp chú trọng đến những nguyên lí có liên quan và việc lí giải kết quả, bởi vì sự có mặt rộng rãi những phương tiện tính toán, do đó việc làm quen với những chi tiết của tính toán không còn cần thiết nữa. Những phần cao cấp hơn có thể được bỏ qua trong lần đọc đầu, như đã chỉ ra trong những phần thích hợp của bài. Dù vậy, chúng tôi đề nghị phần mở đầu của tất cả các chương cần được đọc bởi vì nó cho phép đưa các phương pháp khác nhau vào bối cảnh.

Người đọc cũng sẽ tìm thấy những chủ đề như test khuynh hướng cho bảng nhiều chiều, phương pháp chuẩn hóa, sử dụng phép biến đổi, phân tích sống còn và nghiên cứu bệnh chứng. Phần tư cuối của cuốn sách để dành cho những chủ đề liên quan đến việc thiết kế và tiến hành nghiên cứu. Phần này không tách rời khỏi phần phướngphap phân tích và phản ánh tầm quan trọng của nhận thức thống kê thông qua thực hiện nghiên cứu. Có một tóm tắt chi tiết làm thế nào để quyết định cỡ mẫu thích hợp và việc đưa vào sử dụng máy vi tính, trong đó có giải thích nhiều từ chuyên môn.

Cuốn sách này là sự kết hợp của nhiều năm kinh nghiệm giảng dạy thống kê cho nhiều người chuyên môn ngành y và kinh nghiệm cộng tác nghiên cứu. Tôi hi vọng cách tiếp cận đã được chọn lựa sẽ hấp dẫn cho bất kì ai làm việc trong hay liên quan đến lãnh vực và sẽ làm hài lòng cả những người chuyên môn y khoa cũng như những nhà thống kê. Ðặc biệt, tôi hi vọng kết quả sẽ trả lời những nhu cầu của nhiều người cho rằng vấn đề tiến hành công việc thống kê không phải là cơ chế của một kiểm định đặc hiệu, mà là biết được phương pháp nào được áp dụng khi nào.

Tôi muốn bày tỏ lòng biết ơn đến những đồng nghiệp, sinh viên và bạn bè đã hỗ trợ tôi trong nhiệm vụ này. Ðặc biệt, tôi muốn cám ơn David Ross và Cesar Victoria đã sẵn sàng độc bản thảo và đã góp ý hết sức chi tiết, Richard Hayes cho nhiều lần thảo luận về giảng dạy trong nhiều năm, Laura Rodrigues đã chia xẻ sự hiểu biết sâu sắc về phương pháp dịch tễ cho tôi, Peter Smith đã góp ý và nâng đỡ chung, Helen Edwards cho sự giúp đỡ kiên nhẫn và lành

Page 6: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

2

nghề trong công tác đánh máy và Jacqui Wright cho việc giúp đỡ trong soạn thảo những bảng phụ lục. Tôi cũng muốn cám ơn chồng tôi là Tom Kirkwood không những chỉ góp ý cho những bản thảo, vô vàn cuộc thảo luận và những giúp đỡ thực tế, mà còn bởi vì sự hỗ trợ và khuyến khích không ngừng. Tôi muốn đề tặng cuốn sách này cho Tom. Cuối cùng tôi muốn nhắc đến Daisy và Sam Kirkwood, mặc dù sự ra đời của hai cháu đã làm chậm trễ việc kết thúc của bản thảo gần hoàn tất, nhưng đã cho tôi một cơ hội để có một cách nhìn mới mẻ vào những gì tôi đã viết và thực hiện những cải tiến quan trọng.

Betty Kirwood

London School of Hygiene and Tropical Medicine

Page 7: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

CĂN BẢN

3

CĂN BẢN

Thống kê là gì? Thống kê là khoa học thu thập, tổng kết, trình bày và lí giải số liệu, và dùng chúng để kiểm định giả thuyết. Trong vài thập niên qua, thống kê đã đóng vai trò trung tâm ngày càng tăng trong các điều tra y khoa. Có nhiều lí do và 3 lí do chính như sau. Ðầu tiên, thống kê cho phép tổ chức các thông tin trên cơ sở rộng hơn và căn bản hơn sự trao đổi các giai thoại và kinh nghiệm cá nhân. Thứ nhì, ngày càng nhiều các thứ có thể đo lường định lượng được trong y khoa. Thứ ba, có sự biến thiên rất lớn trong hầu hết các quá trình sinh học. Thí dụ, huyết áp không chỉ khác nhau từ người này đến người khác, mà trong cùng một người, nó cũng thay đổi từ ngày này sang ngày khác và từ giờ này sang giờ khác. Sự lí giải những số liệu khi có những biến thiên nằm ở trọng tâm của thống kê. Do đó, trong việc điều tra tỉ lệ bệnh tật liên hệ với một nghề nghiệp nhất định có nhiều kích xúc, phương pháp thống kê cần thiết để đánh giá có phải huyết áp trung bình quan sát được cao hơn huyết áp của dân số chung chỉ đơn giản là do sự biến thiên tình cờ hay nó phản ánh một nguy cơ sức khỏe nghề nghiệp thực sự.

Sự biến thiên có thể bắt nguồn từ các tác động ngẫu nhiên của sự tình cờ trong dân số. Cá nhân không phản ứng như nhau đối với cùng một kích thích. Do đó mặc dù, hút thuốc lá và uống rượu nói chung là có hại cho sức khỏe, người ta không hiếm khi nghe thấy một người hút thuốc lá và uống rượu nhiều sống khỏe mạnh tới già, trong khi một người chống rượu và không hút thuốc lại chết trẻ. Một thí dụ khác, đánh giá một vaccine mới. Cá nhân có thể thay đổi về sự đáp ứng với vaccine và sự nhậy cảm và tiếp xúc với bệnh. Không chỉ một số người nào đó không tiêm vaccine không bị bệnh mà một số người có tiêm vaccin có thể bị bệnh. Có thể kết luận được gì nếu phần trăm người không có bệnh cao hơn trong nhóm tiêm vaccine so với nhóm không tiêm vaccine? có phải vaccine có hiệu quả thực sự hay không? có thể kết quả chỉ do tình cờ? hay, có một số các sai lệch trong cách chọn cá nhân được tiêm chủng, thí dụ có phải họ khác nhau về tuổi tác hay giai cấp xã hội khiến cho nguy cơ mắc bệnh thấp hơn? phương pháp phân tích thống kê để phân biệt giữa hai khả năng đầu, trong khi việc lựa chọn thiết kế đúng sẽ loại trừ khả năng thứ ba. Thí dụ này minh họa sự hữu dụng của thống kê không chỉ nằm trong việc phân tích kết quả. Nó cũng có vai trò trong việc thiết kế và tiến hành nghiên cứu.

Dân số và mẫu Có liên hệ với vấn đề cơ bản của sự biến thiên là một điểm quan trọng: trừ khi một cuộc tổng điều tra được tiến hành, số liệu chỉ là của một mẫu (sample) trong một nhóm lớn hơn được gọi là dân số (population). Mẫu được quan tâm không phải bởi vì chính nó mà bởi vì cái mà nó cho người điều tra biết về dân số. Bởi vì sự tình cờ, những mẫu khác nhau sẽ cho những kết quả khác nhau và điều này phải được xét đến khi dùng các mẫu để kết luận về dân số. Hiện tượng này được gọi là sự biến thiên lấy mẫu (sampling variation), nằm ở trọng tâm của thống kê. Nó được trình bày chi tiết ở Chương 3.

Từ 'dân số' được dùng trong thống kê có nghĩa rộng lớn hơn bình thường. Nó không chỉ gồm dân số người mà có thể dùng cho bất kì một tập hợp các đối tượng. Thí dụ, số liệu có thể là mẫu của 20 bệnh viện trong một dân số các bệnh viện của quốc gia. Trong trường hợp đó, dễ dàng có thể thấy rằng có thể liệt kê toàn bộ dân số và có thể chọn mẫu trực tiếp từ đó. Dù vậy trong nhiều trường hợp, dân số và giới hạn của nó không được chỉ rõ một cách chính xác và phải cẩn thận để đảm bảo rằng mẫu thực sự đại diện cho dân số cần lấy thông tin. Dân số này đôi khi được gọi là dân số mục tiêu (target population). Thí dụ, xem một cuộc thử nghiệm vaccine được tiến hành trong các sinh viên tự nguyện. Giả sử rằng đáp ứng với vaccine và tiếp xúc với bệnh tật của sinh viên là điển hình cho cộng đồng nói chung, kết quả có tính áp dụng tổng quát. Mặt khác nếu sinh viên khác về bất kì phương diện nào mà có thể tác động sự đáp ứng với vaccine và tiếp xúc với bệnh tật, kết luận về thử nghiệm chỉ giới hạn cho dân số

Page 8: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

4

sinh viên và không có tính áp dụng tổng quát. Trong trường hợp này, dân số mục tiêu bao gồm không chỉ những người sống hiện nay mà cả những người sống trong tương lai. Hiển nhiên rằng không thể đếm các dân số như vậy.

Xác định dân số Các số liệu thô của điều tra bao gồm các quan sát (observations) trên các cá nhân. Trong nhiều trường hợp cá nhân là con người nhưng không nhất thiết như vậy. Thí dụ, cá nhân có thể là hồng cầu, mẫu nước tiểu, chuột, hay bệnh viện. Số các cá nhân được gọi la cỡ mẫu (sample size). Bất kì khía cạnh nào của cá nhân được đo lường, như huyết áp, hay được ghi nhận, như tuổi và giới tính, được gọi là biến số (variable). Có thể có một hay nhiều biến số trong một nghiên cứu.

Chia các biến số thành các loại khác nhau có ích bởi vì có thể áp dụng các phương pháp thống kê khác nhau cho mỗi loại. Cách chia tổng quát là chia thành biến định tính - qualitative (biến phạm trù - catergorical) hay biến định lượng - quantitative (biến số - numerical). Biến định tính là biến không phải là số như nơi sinh, nhóm dân tộc hay loại thuốc. Một loại đặc biệt là biến nhị phân (binary), trong đó đáp ứng chỉ là một trong hai khả năng. Thí dụ, giới tính là nam hay nữ, bệnh nhân còn sống hay chết. Biến định lượng là biến số và hoặc là rời rạc (discrete) hay liên tục (continous). Giá trị của biến rời rạc thường là số nguyên, như số các trường hợp bạch hầu trong một tuần. Một biến liên tục là sự đo lường trên thang liên tục. Thí dụ là chiều cao, cân nặng, huyết áp và tuổi.

Phân tích số liệu và trình bày kết quả Phương pháp tổng kết và phân tích số liệu để lí giải kết quả của một nghiên cứu là căn bản của cuốn sách này. Có ba điểm chính cần nhấn mạnh ở đây. Thứ nhất là cần tránh áp dụng các phương pháp phức tạp chỉ vì để đạt được sự phức tạp. Ðiều quan trọng là bắt đầu bằng việc sử dụng các tổng kết căn bản và kĩ thuật đồ thị để thăm dò số liệu. Việc phân tích phải đi từ đơn giản đến phức tạp. Phải chọn phương pháp đơn giản nhất phù hợp với yêu cầu của số liệu.

Ðiểm thứ nhì có liên quan là phải ứng dụng các lí luận thống kê cùng với lí trí. Ðiều quan trọng là không để mất nhận thức vào con số, các yếu tố tác động đến chúng và chúng đại diện cho cái gì trong khi thao tác con số trong quá trình phân tích. Bradford Hill (1977), Colton (1974), và Oldham (1968) đã có những chương rất hay minh họa các ngụy biện phổ biến và các khó khăn xuất phát trong việc lí giải số liệu.

22,022,122,222,322,422,522,622,7

1970 1975 1980

IMR/1000 treí sä

0

4

8

12

16

20

24

1970 1975 1980

IMR/

1000

treí

säúng

IMR/

1000

treí

säúng

IMR/

1000

treí

säúng

IMR/

1000

treí

säúng

Hình 1.1 Giảm tỉ suất tử vong trẻ em từ 1970 đến 1980 (a) chọn thang đo không phù hợp làm khuếch đại sai lầm mức giảm (b) dùng thang đo đúng.

Ðiểm thứ ba là nên dùng các kĩ thuật đồ thị (graphical techniques) cả trong giai đoạn thăm dò phân tích và trình bày kết quả, bởi vì sự quan hệ, khuynh hướng, và sự tương phản thường dễ nhận biết trong các giản đồ hơn từ trong bảng. Giản đồ (và bảng) phải luôn luôn được ghi tựa đề rõ ràng và dễ hiểu: không cần thiết phải đọc lại văn bản để hiểu chúng. Ðồng thời chúng

Page 9: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

CĂN BẢN

5

không được lộn xộn với quá nhiều chi tiết và chúng không được gây mơ hồ. Các điểm gẫy và không liên tục trong thang đo phải được đánh dấu rõ ràng và, nếu được, cần phải tránh. Hình 1.1 (a) cho thấy dạng thể hiện sai thường gặp do sử dụng thang đo không phù hợp. Giảm tỉ suất chết trẻ em được làm thấy nhiều lên bằng cách mở rộng trục tung, trong khi thực tế sự giảm trong 10 năm chỉ rất ít (từ 22,7 đến 22,1/1000 sinh sống/năm). Một cách trình bày chân thực hơn ở trong Hình 1.1(b) với trục đứng bắt đầu từ 0.

Chọn máy tính cầm tay Một máy tính cầm tay (calculator) cần thiết cho các ứng dụng thống kê dù là đơn giản nhất. Có một số loại máy khác nhau với nhiều giá cả khác nhau. Các phương tiện dưới đây được coi là tối thiểu

1. Các hàm toán học như lấy căn, logarithm và giai thừa

2. Tối thiểu có một bộ nhớ

3. Tính tự động trung bình và độ lệch chuẩn

4. Tính tự động tương quan và hồi quy tuyến tính

5. Phương tiện lập trình, với khả năng giữ tối thiểu 100 bước lập trình, còn giữ lại khi đã tắt máy tính. Khả năng này phải đủ để cho phép 2 chương trình thường trú trong máy tính đảm bảo sử dụng hai kiểm định thống kê phổ biến nhất, kiểm định t để so sánh 2 trung bình (xem Chương 7) và kiểm định chi bình phương để so sánh hai tỉ lệ (xem chương 13).

Có thể tìm được một máy tính tương đối rẻ tiền (khoảng 30 Bảng Anh) thỏa mãn các điều kiện trên. Các máy mắc tiền hơn có thể có lợi ích là tăng số bước lập trình và khả năng giữ các chương trình trong các vật thể kí tin bên ngoài như thẻ từ tính hoặc băng cassette.

Page 10: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

6

TẦN SUẤT, PHÂN PHỐI TẦN SUẤT VÀ TỔ CHỨC ÐỒ

Giới thiệu Bước đầu tiên trong phân tích là tổng kết số liệu, bởi vì số liệu không được tổ chức sẽ rất khó hiểu. Minh họa số liệu bằng một giản đồ có ghi tựa đề rõ ràng và dễ hiểu sẽ hữu ích.

Tần suất (số liệu định tính) Tổng kết số liệu định tính rất dễ dàng, nhiệm vụ đầu tiên là đếm các quan sát trong mỗi phạm trù. Số quan sát đếm được được gọi là tần suất (frequencies). Chúng thường được trình bày thành tần suất tương đối (relative frequencies), là phần trăm so với tổng số các cá nhân. Thí dụ, bảng 2.4 tổng kết phương pháp đỡ đẻ được ghi nhận trong 600 trường hợp sinh trong bệnh viện. Biến số cần quan tâm là phương pháp đỡ đẻ, một biến định tính có 3 phạm trù, sinh thường, sinh forceps và sinh mổ

Bảng 2.1. Phương pháp đỡ đẻ 600 em bé sinh trong bệnh viện

Phương pháp đỡ đẻ Số sinh phần trăm Sinh thường 478 79,7 Sinh forceps 65 10,8 Sinh mổ 57 9,5 Tổng số 600 100,0 Tần suất và tần suất tương đối thường được minh họa bằng giản đồ thanh (bar diagram) (xem hình 2.1) hay đồ thị hình bánh (pie chart) (xem hình 2.2). Trong giản đồ thanh, chiều dài của thanh được vẽ tỉ lệ với tần suất và trong đồ thị hình bánh, vòng tròn được chia sao cho diện tích của mỗi phần tỉ lệ với tần suất

478478478478

65656565

57575757

0000 100100100100 200200200200 300300300300 400400400400 500500500500

Sinh thæåìngSinh thæåìngSinh thæåìngSinh thæåìng

Sinh forcepsSinh forcepsSinh forcepsSinh forceps

Sinh mäøSinh mäøSinh mäøSinh mäø

Hình 2.1 Giản đồ thanh trình bày phương pháp đỡ đẻ 600 trẻ sinh trong bệnh viện.

Phân phối tần suất (số liệu định lượng) Nếu có nhiều hơn 20 quan sát, bước đầu tiên có ích trong việc tổng kết số liệu định lượng là thành lập phân phối tần suất (frequency distribution). Ðó là bảng trình bày số các quan sát ở các giá trị khác nhau hay trong các khoảng giá trị nhất định. Ðối với biến rời rạc, tần suất có thể lập bảng hoặc là cho mỗi giá trị của biến hoặc là cho một nhóm các giá trị. Với biến liên tục, phải thành lập nhóm. Hình 2.2. trình bày một thí dụ, trong đó hemoglobin được đo lường tới 0,1g/100 ml vvvà nhóm 11- gồm tất cả các đo lường ở giữa 11,0 và 11,9g/100 ml.

Khi thành lập phân phối tần suất, điều đầu tiên cần làm là đếm số các quan sat và xác định giá trị lớn nhất và nhỏ nhất. Sau đó quyết định số liệu có cần phân nhóm hay không và nếu có phải dùng khoảng phân nhóm nào. Nói chung người ta chia thành 5-20 nhóm tùy theo số các

Page 11: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

TẦN SUẤT, PHÂN PHỐI TẦN SUẤT VÀ TỔ CHỨC ÐỒ

7

quan sát. Nếu khoảng được chọn cho việc phân nhóm quá rộng, nhiều chi tiết sẽ bị mất đi, trong khi nếu khoảng quá nhỏ, bảng sẽ khó sử dụng. Ðiểm đầu tiên của nhóm phải là số chẵn và chiều rộng của các khoảng phải bằng nhau nếu có thể. Bảng phải được kí hiệu sao cho có thể quyết định khi quan sát nằm ở ranh giới.

Thí dụ, trong bảng 2.2, có 70 đo lường hemoglobin. Giá trị nhỏ nhất là 8,8 và lớn nhất là 15,1 g/100ml. Chọn chiều rộng khoảng là 1g/100ml sẽ cho 8 nhóm trong phân phối tần suất. Ðặt tên nhóm 8-, 9- là rõ ràng. Có thể đặt tên là 8,0-8,9, 9,0-9,9 v.v... Lưu ý rằng đặt tên 8- 9, 9-10 là không rõ bởi vì người ta không biết đo lường 9,0g/100ml thuộc nhóm nào.

Sinh thæåìngSinh thæåìngSinh thæåìngSinh thæåìng

Sinh mäøSinh mäøSinh mäøSinh mäø

Sinh forcepsSinh forcepsSinh forcepsSinh forceps

Hình 2.2 Ðồ thị hình bánh trình bày phương pháp đỡ đẻ 600 trẻ sinh trong bệnh viện.

Page 12: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

8

Khi đã quyết định dạng thức của bảng, có thể đếm các số trong mỗi nhóm. Có thể tránh được sai lầm bằng cách tiến hành số liệu theo thứ tự. Ðối với một giá trị, đánh dấu vào nhóm thích hợp. Ðể dễ đếm, những đánh dấu này được xếp thành nhóm năm bằng cách gạch dấu thứ năm nằm ngang qua bốn dấu trước đó. Chúng được gọi là cổng năm thanh (five-bar gates). Quá trình này được gọi là đánh dấu (tallying) và được minh họa trong bảng 2.2(b).

Tổ chức đồ Phân phối tần suất thường được minh họa bằng tổ chức đồ (histogram) như được trình bày trong hình 2.3 về số liệu hemoglobin. Dù là dùng tần suất hay phần trăm, hình dạng của tổ chức đồ cũng như nhau.

Bảng 2.2 Nồng độ hemoglobin ở 70 phụ nữ (đơn vị g/100 ml)

(a) Số liệu thô (gạch dưới giá trị lớn nhất và nhỏ nhất) 10.2 13.7 10.4 14.9 11.5 12.0 11.0 13.3 12.9 12.1 9.4 13.2 10.8 11.7 10.6 10.5 13.7 11.8 14.1 10.3 13.6 12.1 12.9 11.4 12.7 10.6 11.4 11.9 9.3 13.5 14.6 11.2 11.7 10.9 10.4 12.0 12.9 11.1 8.8 10.2 11.6 12.5 13.4 12.1 10.9 11.3 14.7 10.8 13.3 11.9 11.4 12.5 13.0 11.6 13.1 9.7 11.2 15.1 10.7 12.9 13.4 12.3 11.0 14.6 11.1 13.5 10.9 13.1 11.8 12.2 (b) phân phối tần suất

Hemoglobin (g/100ml)

đánh dấu số phụ nữ phần trăm

8- 1 1 1.4 9- 111 3 4.3 10- 1111 1111 1111 14 20.0 11- 1111 1111 1111 1111 19 27.1 12- 1111 1111 1111 14 20.0 13- 1111 1111 111 13 18.6 14 1111 5 7.1 15-15.9 1 1 1.4 Tổng số 70 100.0

Page 13: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

TẦN SUẤT, PHÂN PHỐI TẦN SUẤT VÀ TỔ CHỨC ÐỒ

9

Hình 2.3 Tổ chức đồ của nồng độ hemoglobin của 70 phụ nữ

Dễ dàng xây dựng tổ chức đồ khi các khoảng cách nhóm của phân phối tần suất bằng nhau như trong trường hợp hình 2.3. Nếu khoảng có chiều rộng khác nhau, cần phải lưu ý khi vẽ tổ chức đồ nếu không sẽ bị sai lệch. Thí dụ, giả sử hai nhóm hemoglobin cao nhất được kết hợp lại. Tần suất của nhóm kết hợp này (14,0-15,9 g/100ml) sẽ là 6, nhưng rõ ràng sẽ sai lầm nếu vẽ hình chữ nhật có chiều cao 6 từ 14- 16g/100ml. Bởi vì khoảng này lớn gấp đôi chiều rộng khác khoảng khác, chiều cao của đường sẽ là 3, phân nửa của tần suất tổng cộng của nhóm này. Ðiều này được minh họa trong hình 2.3. Quy tắc chung để vẽ tổ chức đồ khi các khoảng không cùng chiều rộng là để chiều cao của hình chữ nhật tỉ lệ với tần suất chia cho chiều rộng, để cho diện tích của hình chữ nhật trong tổ chức đồ tỉ lệ với tần suất.

Ða giác tần suất

Hình 2.4 Ða giác tần suất của nồng độ hemoglobin của 70 phụ nữ.

Một cách khác để minh họa phân phối tần suất nhưng kém phổ biến hơn là đa giác tần suất, được minh họa trong Hình 2.4. Nó đặc biệt có ích khi so sánh hai hay nhiều hơn các phân phối tần suất bằng cách cùng vẽ trên một giản đồ. Ða giác được vẽ bằng cách tưởng tượng (hay vẽ phác bằng chì) tổ chức đồ và nối các trung điểm của cạnh trên hình chữ nhật. Ðiểm cuối của đường vừa vẽ được nối với trục hoành ở điểm giữa của nhóm sát trên nhóm lớn nhất và điểm giữa của nhóm sát dưới nhóm nhỏ nhất. Ðối với số liệu của hemoglobin đó là nhóm 7,0-7,9 và 16,0- 16,9g/100ml. Do đó trên hình 2.4 đa giác tần suất được nối với trục hoành ở 7,5 và 16,5g/100ml.

Phân phối tần suất của dân số Hình 2.3 và 2.4 minh họa phân phối tần suất của hemoglobin của mẫu 70 phụ nữ. Chúng ta dùng số liệu này để cho thông tin về phân phối nồng độ hemoglobin trong phụ nữ nói chung.

Page 14: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

10

Thí dụ, dường như rất ít khi phụ nữ có mức dưới 9,0g/100ml hay trên 15,0g/100ml. Sự tin cậy khi rút ra các kết luận tổng quát từ số liệu phụ thuộc vào có bao nhiêu cá nhân được đo lường. Mẫu được đo càng lớn, các khoảng cách nhóm được chọn càng nhỏ thì tổ chức đồ và đa giác tần suất trở nên mịn hơn và càng giống phân phối của dân số tổng quát. Nếu có thể biết được nồng độ hemoglobin của toàn dân số phụ nữ, giản đồ tạo được sẽ trở thành một đường cong trơn.

Hình dạng của phân phối tần suất Hình 2.5 trình bày 3 hình dạng phân phối tần suất phổ biến nhất. Chúng có tần suất cao ở trung tâm và tần suất thấp ở 2 đầu, được gọi là đuôi trên hay đuôi dưới (upper and lower tails) của phân phối. Phân phối của hình 2.5(a) được gọi là đối xứng (symmetrical) qua tâm; dạng đường cong này thường được gọi là 'hình chuông'. Hai phân bố kia được gọi là bất đối xứng hay lệch (skewed). Ðuôi trên của phân phối trên Hình 2.5(b) dài hơn đuôi dưới; nó được gọi là lệch dương hay lệch về phía phải. Phân phối của hình 2.5(c) là lệch âm hay lệch về phía trái.

Tất cả phân phối trong hình 2.5 là một yếu vị (unimodal) bởi vì chúng chỉ có một đỉnh. Hình 2.6(a) trình bày phân phối tần suất hai yếu vị (bimodal), đó là phân phối có 2 đỉnh. Ðôi khi ta thấy được phân phối này và nó cho thấy số liệu là hỗn hợp của hai phân phối riêng biệt. Hình 2.6 trình bày hai phân phối khác ít gặp khác; đó là phân phối hình J ngược (reverse J-shaped) và đồng nhất (uniform).

(a) đối xứng và hình chuông

td: chiều cao

(b) lệch dương hay lệch phải td: bề dày lớp mỡ dưới da

(c) lệch âmhay lệch trái td: thời gian thai kì

Hình 2.5 Ba dạng phân phối phổ biến và ví dụ của mỗi loại

(a) hai yếu vị

td: nồng độ hormone ở nam và nữ

(b) hình J ngược td: thời gian sống sau khi chẩn

đoán ung thư phổi

(c) đồng nhất td: sự xuất hiện bệnh không theo

mùa

Hình 2.6 Ba dạng phân phối ít phổ biến và ví dụ của mỗi loại

Page 15: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

TRUNG BÌNH, ÐỘ LỆCH CHUẨN VÀ SAI SỐ CHUẨN

11

TRUNG BÌNH, ÐỘ LỆCH CHUẨN VÀ SAI SỐ CHUẨN

Giới thiệu Phân phối tần suất cho một bức tranh tổng quát về giá trị của các biến số. Dù vậy sẽ tiện lợi hơn nếu tổng kết các biến định lượng bằng cách chỉ cho 2 số đo: giá trị trung bình và sự trải rộng của giá trị.

Trung bình, trung vị và yếu vị Giá trị trung bình thường được thể hiện bằng trung bình cộng (arithmetic mean), thường được gọi là trung bình. Ðó là tổng số các giá trị chia cho số các giá trị

Trung bình, n

xx ∑=

Trong đó x biểu thị giá trị của biến số, S (mẫu tự tiếng Hy lạp sigma hoa) có nghĩa là tổng của và n là số các quan sát. Trung bình được kí hiệu là x (đọc là 'x gạch').

Một số đo khác của giá trị trung bình là trung vị (median) và yếu vị (mode). Trung vị là giá trị chia phân phối làm đôi. Nếu các giá trị được sắp theo thứ tự tăng dần, trung vị là quan sát ở chính giữa.

Trung vị = giá trị ở vị trí 2

)1( +n trong các quan sát được sắp thứ tự

Nếu có một số chẵn các quan sát, không có quan sát ở chính giữa thì người ta lấy trung bình của 2 quan sát ở giữa. Yếu vị (mode) là giá trị xảy ra thường xuyên nhất

Thí dụ 3.1

Số liệu sau là thể tích huyết tương của 8 người đàn ông khỏe mạnh

2,75 2,86 3,37 2,76 2,62 3,49 3,05 3,12 lít (a) n = 8

Σ x = 2,75 + 2,86 + 3,37 + 2,76 + 2,62 + 3,49 + 3,05 + 3,12 = 24,021 Trung bình, x = Σ x/n = 24,02/8 = 3,001

(b) sắp xếp lại các số đo theo thứ tự tăng dần

2,62; 2,75; 2,76; 2,86; 3,05; 3,12; 3,37; 3,49 Trung vị = giá trị thứ (n+1)/2 = 9/2 = giá trị thứ 4,5 = trung bình của giá trị thứ 4 và thứ 5 = (2,86+3,05)/2 = 2,96

(c) không có ước lượng của yếúu vị bởi vì các giá trị đều khác nhau

Trung bình thường là số đo được chọn lựa bởi vì nó tính đến mỗi quan sát cá nhân và có thể được xử lí bằng kĩ thuật toán và thống kê. Trung vị là số đo mô tả hữu ích nếu có một hoặc hai giá trị quá cao hoặc quá thấp, làm cho trung bình không đại diện được đa số số liệu. Yếu vị ít khi được dùng. Nếu mẫu nhỏ thì có thể không ước lượng được yếu vị (như trong ví dụ 3.1c) hay ước lượng bị sai lệch. Trung bình, trung vị và yếu trị, nói chung là bằng nhau khi phân phối đối xứng và có một yếu vị. Khi phân phối bị lệch dương, trung bình nhân (geomtric mean) thích hợp hơn trung bình cộng. Ðiều này được thảo luận ở Chương 19.

Số đo sự biến thiên Số đo sự biến thiên đơn giản nhất là phạm vi (range), đó là hiệu số giữa giá trị lớn nhất và nhỏ nhất. Khuyết điểm của nó là chỉ dựa trên hai quan sát và không cho ý niệm về cách các quan sát khác sắp xếp ra sao. Tương tự, khi cỡ mẫu càng lớn thì phạm vi càng lớn.

Page 16: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

12

Bởi vì sự biến thiên nhỏ khi các quan sát tập trung gần chung quanh trung bình và lớn khi các quan sát phân tán trên một phạm vi đáng kể, sự biến thiên thường được đo lường theo độ lệch (deviation) của các quan sát so với trung bình. Phương sai (variance) là trung bình của bình phương những hiệu số này. Khi tính phương sai của một mẫu, tổng của độ lệch bình phương được chia cho (n-1) chứ không phải cho n bởi vì như vậy sẽ cho một ước lượng tốt hơn của phương sai dân số toàn bộ.

Phương sai, )1()( 2

2

−−

= ∑n

xxs

Ðộ tự do

Mẫu số (n-1) được gọi là độ tự do (degrees of freedom) của phương sai. Con số này là (n-1) chứ không phải là n, bởi vì chỉ có (n-1) độ lệch (x- x) độc lập với nhau. Ðộ lệch cuối cùng có thể được tính từ các độ lệch khác bởi vì tổng tất cả các độ lệch bằng zero.

Ðộ lệch chuẩn

Phương sai có các tính chất toán học thuận lợi và là số đo thích hợp khi nghiên cứu lí thuyết thống kê. Dù vậy, nó có một khuyết điểm là nó có đơn vị là bình phương đơn vị của quan sát. Thí dụ, nếu quan sát là trọng lượng tính bằng gram thì phương sai là gram bình phương. Trong nhiều trường hợp sẽ thuận lợi hơn khi biểu thị độ biến thiên theo đơn vị ban đầu bằng cách lấy căn của phương sai. Nó được gọi là độ lệch chuẩn (standard deviation - SD).

−−

= ∑)1()(

shay 2

nxx

SD

Hay tương đương

−= ∑ ∑

)1(/)(

shay 22

nnxx

SD

Công thức sau tiện lợi hơn cho việc tính toán bởi vì không cần phải tính trung bình và sau đó trừ các giá trị quan sát cho trung bình. Tương đương của hai công thức trên được minh họa trong thí dụ 3.2 (lưu ý: nhiều máy tính cầm tay có những hàm để tính trung bình và độ lệch chuẩn. Các phím bấm thường được kí hiệu bằng x và σn-1, trong đó ơ là mẫu tự Hi lạp sigma thường).

Thí dụ 3.2

Bảng 3.1 trình bày các bước của tính toán độ lệch chuẩn của 8 số đo thể tích huyết tương ở thí dụ 3.1. Lưu ý rằng

Σ x2-(Σ x)2/n = 72,7980 - (242)2/8 = 0,6780 Cho kết quả giống như Σ (x- x)2:

s = 0,6780/7=0,311

Page 17: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

TRUNG BÌNH, ÐỘ LỆCH CHUẨN VÀ SAI SỐ CHUẨN

13

Lí giải

Thông thường 70% quan sát nằm trong phạm vi một độ lệch chuẩn so với kể từ trung bình và khoảng 95% nằm trong phạm vi hai độ lệch chuẩn. Các con số này dựa trên một phân phối tần suất lí thuyết được gọi là phân phối bình thường, được mô tả ở chương 4.

Hệ số biến thiên (Coefficient of variation)

%100c.v. ×=xs

Hệ số biến thiên là độ lệch chuẩn tính theo phần trăm của trung bình mẫu. Chúng hữu ích khi cần quan tâm đến độ lớn của sự biến thiên so với độ lớn của quan sát, và nó có ưu điểm là hệ số biến thiên độc lập với đơn vị của quan sát. Thí dụ giá trị của độ lệch chuẩn của các trọng lượng sẽ khác nhau tùy theo chúng được đo lường theo kilogram hay pound. Dù vậy, hệ số biến thiên sẽ giống như nhau.

Tính toán trung bình và độ lệch chuẩn từ phân phối tần suất Bảng 3.2 trình bày phân phối của số các lần mang thai trước của một nhóm phụ nữ khám tiền sản. Mười tám trong 100 phụ nữ không có mang trước đó, 27 đã có mang một lần, 31 có mang hai lần, 19 có mang 3 lần và 5 phụ nữ có mang 4 lần. Vì cộng 2 ba mươi mốt lần cũng giống như tích của (2 x 31), tổng số của các lần có thai trước đó được tính bằng:

Σ x=(0 ×18)+(1 × 27)+(2 × 31)+(3 × 19)+(4 × 5)=0 + 27 + 62 + 57 + 20 =166 Do đó số trung bình của các lần mang thai trước đó là

x= 166/100=1,66 Tương tự

Σ x2= (0 × 18)+(1 × 27)+(22 × 31)+(32 × 19)+(42 × 5) = 0+27+124+171+80=402 Do đó độ lệch chuẩn

s= √ [(402 -1662/100)/99] = [126,44/99] = 1,13 Bảng 3.2 Phân phối của số các lần có thai trước của một nhóm phụ nữ tuổi từ 30 đến 34 đến khám tại phòng khám tiền sản

Bảng 3.1 Tính toán độ lệch chuẩn của thể tích huyết tương của 8 đàn ông khỏe mạnh (giống như trong thí dụ 3.1). Trung bình, x=3,001

Thể tích huyết tương

x Ðộ lệch khỏi

trung bình x- x

Bình phương độ lệch (x- x)2

bình phương của quan sát

x2

2.75 -0.25 0.0638 7.5625 2.86 -0.14 0.0203 8.1796 3.37 0.37 0.1351 11.3569 2.76 -0.24 0.0588 7.6176 2.62 -0.38 0.1463 6.8644 3.49 0.49 0.2377 12.1801 3.05 0.05 0.0023 9.3025 3.12 0.12 0.0138 9.7344

Tổng 24.02 0.00 0.6780 72.7980

Page 18: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

14

Số lần có thai 0 1 2 3 4 Tổng số

Số phụ nữ 18 27 31 19 5 100

Nếu các biến số được phân nhóm để xây dựng phân phối tần suất, cần phải tính trung bình và độ lệch chuẩn từ các giá trị nguyên thủy chứ không dùng phân phối tần suất. Dù vậy, đôi khi chỉ có phân phối tần suất. Trong trường hợp đó, giá trị xấp xỉ của trung bình và phương sai có thể tính được bằng cách dùng giá trị trung điểm của nhóm và tiến hành như trên.

Thay đổi đơn vị Cộng hay trừ quan sát cho một hằng số làm trung bình cũng cộng hay trừ hằng số đó nhưng không thay đổi độ lệch chuẩn. Nhân hay chia các quan sát cho một hằng số làm trung bình và độ lệch chuẩn cũng nhân hay chia cho hằng số đó.

Thí dụ, giả sự nhiệt độ được chuyển từ độ Fahrenheit thành Celsius bằng cách trừ cho 32 và nhân cho 5 và chia cho 9. Trung bình mới sẽ được tính từ trung bình cũ theo cách tương tự như vậy: trừ cho 32, nhân 5 và chia cho 9. Ðộ lệch chuẩn mới là độ lệch chuẩn cũ nhân 5 và chia cho 9 bởi vì phép trừ không tác động đến độ lệch chuẩn.

Sai số lấy mẫu và sai số chuẩn Như đã nói ở Chương 1, mẫu được quan tâm không phải vì chính nó mà bởi vì nó nói cho người nghiên cứu về dân số mà nó đại diện. Trung bình mẫu, x, và độ lệch chuẩn,s , được dùng để ước lượng trung bình và độ lệch chuẩn của dân số, kí hiệu bằng chữ Hi lạp µ (mu) và s (sigma). Trung bình mẫu không thể chính xác bằng trung bình dân số. Một mẫu khác sẽ cho ước lượng khác, sự khác biệt là do sự biến thiên lấy mẫu. Giả sử tiến hành lấy nhiều mẫu độc lập có cỡ bằng nhau và tính trung bình mẫu cho mỗi mẫu và tạo phân phối tần suất của các trung bình đó. Trung bình của phân phối sẽ bằng với trung bình của dân số và có thể chứng minh rằng độ lệch chuẩn sẽ bằng s /√ n. Nó được gọi là sai số chuẩn của trung bình mẫu (standard error of the sample mean) và nó đo lường trung bình của dân số được ước lượng bởi trung bình mẫu chính xác tới mức nào. Ðộ lớn của sai số chuẩn phụ thuộc vào sự biến thiên trong dân số và cỡ mẫu. Mẫu càng lớn thì sai số chuẩn càng nhỏ.

Chúng ta ít khi biết được độ lệch chuẩn của dân số, s, và vì vậy chúng ta dùng độ lệch chuẩn mẫu để tính sai số chuẩn

ns=s.e.

Thí dụ 3.3

Trung bình của 8 thể tích huyết tương được trình bày trong bảng 3.1 là 3,001 (thí dụ 3.1) và độ lệch chuẩn là 0,311 (thí dụ 2). Sai số chuẩn của trung bình được tính bằng

s/√ n=0,31/√ 8=0,111 Thí dụ 3.4

Hình 3.1 trình bày kết quả của một trò chơi trong một lớp học có 30 sinh viên để minh họa khái niệm biến thiên lấy mẫu, phân phối lấy mẫu và sai số chuẩn. Người ta đo lường huyết áp của 250 phi công. Phân phối của đo lường này được trình bày trong hình 3.1(a). Trung bình dân số, µ là 78,2mmHg và độ lệch chuẩn dân số, s, là 9,4mmHg. Mỗi giá trị được viết trên một đĩa nhỏ và 250 đĩa được đặt trong một cái túi. Mỗi sinh viên được đề nghị lắc túi chọn 10 đĩa và viết 10 huyết áp tâm trương. Bằng cách này ta có 30 mẫu khác nhau và 30 trung bình mẫu khác nhau, mỗi trung bình đều ước lượng cùng một trung bình dân số. Trung bình của những trung bình mẫu này là 78,23 mmHg, gần với trung bình dân số. Phân phối được trình

Page 19: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

TRUNG BÌNH, ÐỘ LỆCH CHUẨN VÀ SAI SỐ CHUẨN

15

bày trong hình 3.1(b). Ðộ lệch chuẩn của trung bình mẫu là 31 mmHg, phù hợp với giá trị lí thuyết, s /√n=9,4/√10=2,97 mmHg sai số chuẩn của trung bình có cỡ mẫu là 10. Bài tập được lập lại với cỡ mẫu 20, kết quả được trình bày trong hình 3.1(c). Dễ dàng thấy sự giảm biến thiên của trung bình mẫu do việc tăng cỡ mẫu từ 10 lên 20. Trung bình của trung bình mẫu là 78,14 mmHg cũng gần với trung bình dân số. Ðộ lệch chuẩn là 2,07 mmHg, cũng phù hợp với giá trị lí thuyết 9,4/√ 20=2,10 mmHg

Lí giải

Lí giải sai số chuẩn của trung bình mẫu tương tự như sai số chuẩn. Khoảng 95% trung bình mẫu có được bởi sự lấy mẫu lập lại sẽ nằm trong phạm vi hai độ lệch chuẩn so với trung bình dân số. Ðiều này được dùng để xây dựng một phạm vi giá trị khả dĩ của trung bình dân số, dựa trên các trung bình mẫu quan sát được và sai số chuẩn của nó. Những phạm vi như vậy được gọi là khoảng tin cậy (confidence interval). Phương pháp xây dựng khoảng tin cậy được trình bày ở Chương 5 bởi vì nó sử dụng đến phân phối bình thường, được mô tả ở Chương 4.

Sự hiệu chỉnh dân số giới hạn

Nếu cỡ mẫu trong một dân số có giới hạn, thí dụ như các căn nhà trong một làng, sai số lấy mẫu có thể nhỏ hơn s /√ n khi phần lớn dân số được lấy mẫu. Nó sẽ bằng 0 nếu toàn thể dân số được lấy mẫu không phải là do không có sự biến thiên trong các cá nhân trong dân số, nhưng bởi vì trung bình mẫu chính là trung bình dân số. Một mẫu thứ hai có cỡ tương tự (toàn dân số) sẽ có kết quả tương tự. Khi đó người ta áp dụng sự hiệu chỉnh dân số giới hạn (finite population correction) cho sai số chuẩn. Công thức trở thành

Nn-1 haûn tåïi säú dán chènh hiãûu s.e.våïi

=

Trong đó N là kích thước của dân số và n/N là phân số lấy mẫu (sampling fraction).

Bỏ qua sự hiệu chỉnh dân số giới hạn gây nên sự ước lượng thừa sai số chuẩn. Thí dụ, nếu 75% dân số được lấy mẫu, hiệu chỉnh dân số giới hạn sẽ bằng (1-0,75)=0,5. Nếu bỏ qua điều này, sai số chuẩn sẽ gấp đôi giá trị chính xác. Sự hiệu chỉnh ít có tác động và có thể bị bỏ qua khi phân số lấy mẫu nhỏ hơn 10%.

Page 20: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

16

PHÂN PHỐI BÌNH THƯỜNG

Giới thiệu Phân phối tần suất và các hình dạng của nó được thảo luận ở Chương 2. Trên thực tế người ta thấy rằng có thể mô tả hợp lí nhiều biến số bằng phân phối bình thường (normal distribution), đôi khi còn được gọi là phân phối Gauss (Gaussian distribution) theo tên của người phát hiện Gauss. Ðường cong của phân phối bình thường đối xứng qua trung bình và có dạng hình chuông; hình chuông cao và hẹp đối khi độ lệch chuẩn nhỏ và thấp và rộng khi độ lệch chuẩn lớn. Hình 4.1 minh họa phân phối bình thường mô tả chiều cao của người lớn ở Anh. Một thí dụ khác về biến số được phân phối xấp xỉ bình thường là huyết áp, thân nhiệt và nồng độ hemoglobin. Thí dụ của các biến số không phân phối bình thường là bề dày lớp mỡ dưới da sau cánh tay và thu nhập, cả hai biến này đều bị lệch dương. Ðôi khi biến đổi một biến, thí dụ như lấy logarithm sẽ làm phân phối trở thành bình thường. Ðiều này được mô tả ở Chương 19 và cách đánh giá xem một biến số có phân phối bình thường không được mô tả ở chương 18.

Phân phối bình thường quan trọng không chỉ bởi vì nó mô tả tốt các biến số mà còn bởi vì nó có một vai trò trọng tâm trong kĩ thuật phân tích thống kê. Thí dụ, nó là cơ sở lí luận cho việc tính toán khoảng tin cậy được trình bày ở chương 3 và được mô tả ở chương 5. Nó cũng là cơ sở cho phương pháp kiểm định mức ý nghĩa của trung bình được giới thiệu ở Chương 6. Vì những lí do này, điều quan trọng là mô tả việc ứng dụng phân phối bình thường một cách chi tiết trước khi trình bày tiếp mặc dù chúng ta không quan tâm đến phương trình toán học chính xác để định nghĩa bởi vì chúng ta đã có bảng.

Hình 4.1 Giản đồ trình bày đường cong xấp xỉ bình thường mô tả chiều cao đàn ông trưởng thành

Phân phối bình thường chuẩn Nếu một biến có phân phối bình thường thì việc đổi đơn vị không tác động đến chúng. Do đó dù chiều cao đo bằng centimetre hay bằng inch nó cũng phân phối bình thường. Thay đổi trung bình chỉ có nghĩa là chuyển đường cong qua lại trục trong khi thay đổi độ lệch chuẩn thay đổi chiều cao và chiều rộng của đường cong.

Ðặc biệt, bằng cách thay đổi đơn vị, bất cứ một biến số có phân phối bình thường nào cũng có thể thành phân phối bình thường chuẩn (standard normal distribution - còn gọi là phân phối chuẩn) có trung bình bằng 0 và độ lệch chuẩn bằng 1. Có thể làm được điều này bằng cách trừ mỗi quan sát cho trung bình rồi chia cho độ lệch chuẩn. Quan hệ là

σ = 6,5 cm µ = 171,5 cm

Page 21: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

PHÂN PHỐI BÌNH THƯỜNG

17

σµ−= xzSND,

-3 -2 -1 0 -1 2 3

σ = 6,5 cmµ = 171,5 cm

Hình 4.2 Quan hệ giữa phân phối bình thường theo đơn vị đo lường nguyên thủy và theo độ lệch bình thường chuẩn

SND = (chiều cao -171, 5)/6,5 Chiều cao = 171, 5 + (6, 5 x SND)

Trong đó x là biến nguyên thủy có trung bình m và độ lệch chuẩn s và z là độ lệch bình thường chuẩn (standard normal deviate - SND). Ðiều này được minh họa cho phân phối chiều cao đàn ông trong hình 4.2. Khả năng chuyển bất kì một biến có phân phối bình thường thành độ lệch bình thường chuẩn (SND) có nghĩa là chỉ cần một bảng cho phân phối bình thường chuẩn và không cần tất nhiều bảng cho tất cả các giá trị trung bình và độ lệch chuẩn khác nhau. Có hai cách phổ biến nhất để tạo thành bảng (i) diện tích dưới đường cong phân phối tần suất và (ii) điểm bách vị

Bảng tính diện tích dưới đường cong của phân phối bình thường Bảng tính diện tích dưới đường cong phân phối bình thường của một phân phối bình thường hữu ích trong việc xác định tỉ lệ dân số có giá trị trong một phạm vi nhất định. Ðiều này đươc minh họa trong hình 4.1 và 4.2 về chiều cao của đàn ông ở Anh, có phân phối bình thường với trung bình µ =171,5 cm và độ lệch chuẩn s = 6,5 cm.

Diện tích ở đuôi trên của phân phối

Phân phối bình thường có thể được dùng để ước lượng tỉ lệ đàn ông cao hơn 180 cm. Tỉ lệ này được xem là phân số diện tích nằm dưới đường cong phân phối tần suất ở bên phải 180 cm. Ðộ lệch bình thường chuẩn tương ứng là

31.15.6

5.171180 =−=z

Ðiều này tương đương với tỉ lệ diện tích của phân phối bình thường chuẩn ở bên phải 1,31. Diện tích này được minh họa trên hình 4.3 (a) và có thể tìm thấy từ bảng A1. Hàng của bảng chỉ giá trị z với một số lẻ và cột chỉ số lẻ thứ hai. Do đó diện tích trên 1,31 được ghi ở hành 1,3 và cột 0,01 và do đó là 0,0951. Chúng ta có thể kết luận 0,0951 hay 9,51% đàn ông cao hơn 180 cm.

Page 22: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

18

-3 -2 -1 0 -1 2 3 -3 -2 -1 0 -1 2 3 -3 -2 -1 0 -1 2 3

0.1587 0.2946

1-0.1587-0.2946=0.5467

Hình 4.3 thí dụ tính toán các diện tích của phân phối bình thường chuẩn

Diện tích ở đuôi dưới của phân phối

Tỉ lệ đàn ông thấp hơn 160 cm có thể được ước tính tương tự

77.15.6

5.171160 −=−=z

Diện tích cần thiết được minh họa ở hình 4.3(b). Bởi vì phân phối bình thường chuẩn là đối xứng qua 0 nên diện tích bên trái z=-1,77 cũng bằng diện tích bên phải z=1,77 và là 0,0375. Do đó 3,75 đàn ông thấp hơn 160 cm.

Diện tích phân phối giữa hai giá trị

Tỉ lệ đàn ông có chiều cao giữa 165cm và 175 cm được ước tính bằng cách tìm tỉ lệ đàn ông thấp hơn 165cm và cao hơn 175 cm và lấy 1 trừ đi chúng. Ðiều này được minh họa bởi hình 4.3 (c)

(i) độ lệch bình thường chuẩn tương ứng với 165 cm là

15.6

5.171165 −=−=z

Tỉ lệ dưới chiều cao này là 0,1587

(ii) độ lệch bình thường chuẩn tương ứng với 175 cm là

54.05.6

5.171175 =−=z

Tỉ lệ trên chiều cao này là 0,2946

(iii) Tỉ lệ đàn ông có chiều cao giữa 165 cm và 175 cm là

1 - tỉ lệ dưới 165 cm - tỉ lệ trên 175 cm

= 1 -0,1587 -0,2946 = 0,5467 hay 54,67%

Giá trị tương ứng với một diện tích đuôi nhất định

Bảng A1 có thể dùng theo cách khác, đó là bắt đầu với diện tích và tìm điểm z tương ứng. Thí dụ, chiều cao nào thấp hơn 5% chiều cao của dân số? Hãy nhìn vào bảng tìm giá trị gần nhất với 0,05 ở hàng 1,6 và cột 0,04 vậy giá trị z cần thiết là 1,64. Chiều cao tương ứng được tìm thấy bằng cách chuyển đổi:

x = µ + zσ = 171,5 + (1,64 × 6,5) = 182,2 cm

(a) diãûn têch trãn z=1,31 tçm trong baíng A1

0.0951

(b) diãûn têch dæåïi z=1,77 bàòng diãûn têch trãn z=1,77 do âäúi xæïng

(c) diãûn têch giæîa z=1 vaì z=0,54 tçm bàòng caïch træì

0.0375

0.0375

Page 23: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

PHÂN PHỐI BÌNH THƯỜNG

19

Các điểm phần trăm của phân phối bình thường Một cách lí giải hữu dụng của độ lệch bình thường chuẩn là nó biểu thị giá trị của biến số cách số trung bình bao nhiêu độ lệch chuẩn. Ðiều này được trình bày trên thang đo của giá trị nguyên thủy trong hình 4.4. Do đó z=1 tương ứng với giá trị ở một độ lệch chuẩn trên trung bình và z=-1 là giá trị ở một độ lệch chuẩn dưới trung bình. Diện tích trên z=1 và dưới z=-1 đều là 0,1587 hay 15,87%. Do đó 31,74% phân phối cách trung bình hơn một độ lệch chuẩn hay nói cách khác 68,26% phân phối nằm trong phạm vi 1 độ lệch chuẩn so với trung bình. Tương tự, 4,55% phân phối cách trung bình hơn 2 độ lệch chuẩn hay nói cách khác 95,45% phân phối nằm trong phạm vi 2 độ lệch chuẩn so với trung bình. Ðiều này là cơ sở lí luận cho việc lí giải của độ lệch chuẩn ở Chương 3.

-3 -2 -1 0 -1 2 3

µ µ+σµ−σµ−2σµ−3σ µ+3σµ+2σ

Hình 4.4 Lí giải SND bằng thang đo cho thấy số độ lệch chuẩn cách xa khỏi trung bình

Giá trị z bao gồm chính xác 95% phân phối giữa -z và z là 1,96 (hình 4.5a). 1,96 là điểm 5 phần trăm (5% percentage point) của phân phối bình thường bởi vì 5% phân phối cách trung bình hơn 1,96 lần độ lệch chuẩn (2,5% ở mỗi đuôi). Tương tự như vậy 2,58 là điểm phần trăm 1%. Các điểm phần trăm thường dùng được lập thành bảng A2. Lưu ý rằng các điểm phần trăm có thể tìm được từ bảng A1.

Ðiểm phần trăm được mô tả ở đây được gọi là điểm phần trăm hai đuôi (two- sided) bởi vì chúng bao gồm cả các quan sát ở đuôi trên và dưới của phân phối. Một vài cuốn sách lập bảng điểm phần trăm một đuôi (one- sided) chỉ xét đến một đuôi của phân phối (hình 4.5b). Thí dụ 1,96 là điểm 2,5% một đuôi bởi vì 2,5% phân phối bình thường chuẩn ở trên 1,96 và nó chính là điểm 5% hai đuôi. Sự khác biệt này được thảo luận lại ở Chương 6 trong phần kiểm định ý nghĩa.

-1.96 0 1.96

-1.96 0 1.96

Hình 4.5 Ðiểm phần trăm của phân phối bình thường (a) 1.96 laì âiãøm 2.5% mäüt bãn hay laì âiãøm 5% hai bãn

2.5% 2.5%

(b) z laì âiãøm a% mäüt bãn hay laì âiãøm 2a% hai bãn

a% a%

Page 24: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

20

Page 25: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

KHOẢNG TIN CẬY CỦA TRUNG BÌNH

21

KHOẢNG TIN CẬY CỦA TRUNG BÌNH

Giới thiệu Sự biến thiên lấy mẫu và sai số chuẩn của trung bình mẫu được thảo luận ở Chương 3. Ở đây chúng ta xét bằng cách nào chúng ta có thể dùng trung bình mẫu và sai số chuẩn để biết được giá trị khả dĩ của trung bình dân số mà thường không biết được.

Trường hợp mẫu cỡ lớn (phân phối bình thường) Chúng ta đã lưu ý ở Chương 3 rằng khoảng 95% của trung bình mẫu trong phân phối thu được bằng cách lấy mẫu lập lại sẽ nằm trong phạm vị hai sai số chuẩn trên hay dưới trung bình dân số. Ðiều này dựa trên giả thiết rằng tính phân phối bình thường của trung bình mẫu và trung bình của phân phối là trung bình của dân số, µ, và độ lệch chuẩn là sai số chuẩn của trung bình mẫu, s /√ n. Ðiều này có thể được biện minh khi cỡ mẫu lớn, thí dụ như n lớn hơn 60 bởi vì gần như luôn luôn phân phối của trung bình mẫu là bình thường (xem ở dưới); hơn nữa, độ lệch chuẩn mẫu, s, là một ước lượng đáng tin cậy của độ lệch chuẩn dân số, s, thường không biết. Từ Chương 4 chúng ta có thể khẳng định chính xác rằng 95% trung bình mẫu phải nằm trong phạm vi 1,96 sai số chuẩn so với trung bình dân số, 19,6 là điểm 5% của phân phối bình thường chuẩn. Do đó 95% là xác suất một trung bình mẫu nằm trong phạm vi 1,96 sai số chuẩn so với trung bình dân số

Trên thực tiễn, kết quả này được dùng để từ trung bình mẫu quan sát ( x) và sai số chuẩn (s.e.=s/√ n) ước lượng phạm vi trung bình dân số khả dĩ nằm trong đó. Bởi vì có xác suất 95% trung bình mẫu nằm trong 1,96 sai số chuẩn so với trung bình mẫu, có xác suất 95% khoảng nằm giữa x - 1,96 s.e. và x + 1,96 s.e. chứa trung bình dân số (chưa biết). Khoảng từ x - 1,96 s.e. đến x + 1,96 s.e. cho được xem là các giá trị khả dĩ của trung bình dân số. Nó được gọi là khoảng tin cậy 95% (95% confidence interval - c.i.) của trung bình dân số, và x + 1,96 s.e. và x - 1,96 s.e. là giới hạn tin cậy 95% (95% confidence limits) của trung bình dân số.

Khoảng tin cậy 95% cho mẫu lớn = x ± (1,96 × s/√ n)

Khoảng tin cây cho các phần trăm khác được tính cũng giống như vậy và dùng điểm phần trăm tương ứng, z', của phân phối bình thường chuẩn thay vì 1,96. Thí dụ khoảng tin cậy 99% là x ± (2,58 × s.e.)

Khoảng tin cậy mẫu lớn = x ± (z' × s/√ n)

Thí dụ 5.1

Trong chương trình khống chế sốt rét, người ta dự tính phun tất cả 10.000 nhà ở một vùng nông thôn với thuốc diệt côn trùng và cần thiết ước lượng số lượng cần thiết. Bởi vì không thể đo lường tất cả 10.000 nhà, người ta chọn một mẫu ngẫu nhiên 100 nhà và đo diện tích bề mặt có thể phun thuốc của từng căn nhà.

Diện tích bề mặt có thể phun thuốc trung bình của 100 nhà này là 23,2 m2 và độ lệch chuẩn là 5,9 m2. Diện tích trung bình của mẫu 100 căn nhà ( x) không thể bằng chính xác diện tích trung bình của 10.000 nhà (µ ). Ðộ chính xác được đo lường bằng sai số chuẩn s/√ n gần bằng s/√ n=5,9/100=0,6 m2. Xác suất 95% trung bình mẫu (23,2m2) khác với trung bình dân số ít hơn 1,96 s.e. = 1,96 × 0,6 = 1,2 m2. Khoảng tin cậy 95% là

x ± 1,96 × s/√ n = 23,2 ± 1,2 = 22,0 đến 24,4 m2

Page 26: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

22

Người ta quyết định dùng giới hạn tin cậy 95% trên trong dự trù cho lượng thuốc trừ sâu cần thiết bởi vì người ta muốn tính thừa hơn là tính thiếu. Một lít thuốc trừ sâu đủ phun cho 50 m2 và lượng dự trù là

10.000 x 24,4/50 =4880 lít Dầu vậy vẫn con có khả năng không có đủ thuốc trừ sâu. Khoảng 22,0 tới 44,4 m2 cho phạm vi các giá trị khả dĩ của diện tích bề mặt trung bình của tất cả 10.000 nhà. Có xác suất 95% khoảng này chứa trung bình dân số nhưng có xác suất 5% là chúng không chứa trung bình dân số và có xác suất 2,5% ước lượng dựa trên giới hạn tin cậy trên là quá nhỏ. Ước lượng cẩn thận hơn lượng thuốc diệt côn trùng cần thiết cần dựa trên khoảng tin cậy rộng hơn, thí dụ như 99%, thì xác suất ước lượng thiếu sẽ nhỏ hơn (0,05%).

Mẫu nhỏ Khi tính toán khoảng tin cậy chúng ta giả thuyết rằng cỡ mẫu là lớn (lớn hơn 60). Khi cỡ mẫu không lớn có hai khía cạnh sẽ thay đổi. Thứ nhất, độ lệch chuẩn mẫu, s, dễ bị tác động bởi các biến thiên lấy mẫu, có thể không phải là ước lượng đáng tin cậy của s . Thứ nhì, khi phân phối của dân số phi bình thường, phân phối của trung bình mẫu cũng có thể phi bình thường.

Tác động thứ nhì chỉ có ý nghĩa thực tiễn khi cỡ mẫu rất nhỏ (nhỏ hơn 15) và khi phân phối của dân số rất khác bình thường. Ðiều này là do một tính chất toán học rất hữu ích được gọi là định lí giới hạn trung tâm (central limit theorem) khẳng định rằng ngay cả biến không có phân phối bình thường, trung bình mẫu có khuynh hướng phân phối bình thường (có thể biểu diễn thực tế của định lí này bằng cách tiến hành một trò chơi lấy mẫu như trong thí dụ 3.4 nhưng thay thế 250 huyết áp bằng một dân số phân phối phi bình thường. Mẫu càng lớn thì trung bình mẫu càng gần với phân phối bình thường; cỡ mẫu cần thiết để cho xấp xỉ bình thường phụ thuộc vào dân số có phân phối bình thường nhiều hay ít nhưng trong phần lớn các trường hợp, cỡ mẫu 15 là đủ.

Bởi vì định lí giới hạn trung tâm, nên thường chỉ có vấn đề thứ nhất là sự biến thiên s do lấy mẫu mới khiến cho không thể sử dụng phân phối bình thường để tính khoảng tin cậy. Thay vào đó người ta dùng phân phối t. Nói chính xác, điều này chỉ đúng đắn khi dân số có phân phối bình thường. Dù vậy việc dùng phân phối t là xác đáng trừ khi dân số phân phối rất phi bình thường (tính chất ngày được gọi là tính vững (robustness)). Sau này chúng ta sẽ trình bày phải làm gì trong trường hợp cực kì phi bình thường.

Khoảng tin cậy dùng phân phối t Các tính toán khoảng tin cậy ở trên dùng phân phối bình thường dựa trên sự kiện ( x-µ )/(s/√ n) là một giá trị của phân phối bình thường và chúng ta có thể dùng s tay cho s đối với mẫu lớn. Trên thực tế, ( x- µ)/(s/√ n) không phải là một giá trị của phân phối bình thường mà là của phân phối t với (n-1) độ tự do (t distribution with (n-1) degrees of freedom). Phân phối này được W.S. Gossett, có bút danh là Student, tìm ra và thường được gọi là phân phối t của Student. Giống như phân phối bình thường, phân phối t là một phân phối hình chuông đối xứng có trung bình là zero nhưng trải rộng hơn và có đuôi dài hơn (Hình 5.1)

Hình dạng chính xác của phân phối t phụ thuộc vào độ tự do (degrees of freedom - d.f.) n-1 của độ lệch chuẩn mẫu, s; độ tự do càng nhỏ phân phối t càng trải rộng. Người ta lập bảng A3 điểm phần trăm cho các độ tự do khác nhau. Thí dụ, nếu cỡ mẫu là 8, độ tự do là 7 và điểm 5% là 2,36. Trong trường hợp này khoảng tin cậy 95% dùng độ lệch chuẩn mẫu s là x ± 2,36×s/√n. Nói chung khoảng tin cậy được tính dùng t, điểm phần trăm thích hợp của phân phối t với (n-1) độ tự do.

Khoảng tin cậy cỡ mẫu nhỏ = x + (t × s/√ n)

Page 27: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

KHOẢNG TIN CẬY CỦA TRUNG BÌNH

23

-3 -2 -1 0 -1 2 3 Hình 5.1 Phân phối t có 5 độ tự do so sánh với phân phối bình thường

Ðối với độ tự do nhỏ, điểm phần trăm của phân phối t lớn hơn đáng kể so với điểm phần trăm của phân phối bình thường. Ðiều này do độ lệch chuẩn mẫu s có thể là ước lượng không chính xác của s, và khi tính đến điều này khoảng tin cậy rộng hơn đáng kể so với t đã biết s. Ðối với độ tự do lớn, phân phối t hầu như là giống như phân phối bình thường chuẩn, bởi vì s là ước lượng đúng của s. Ðáy của Bảng A3 trình bày điểm phần trăm của phân phối t với vô hạn (∞) bậc tự do và ta có thể so sánh với Bảng A2 để thấy là chúng giống với phân phối bình thường chuẩn.

Thí dụ 5.2

Sau đây là số giờ không bị đau của 6 bệnh nhân viêm khớp sau khi sử dụng một loại thuốc mới

2,2 2,4 4,9 2,5 3,7 4,3 giờ x = 3,3 giờ, s = 1,13 giờ, n = 6, d.f. = 6-1 = 5 s/√ n = 0,46 giờ Ðiểm 5% của phân phối t với 5 bậc tự do là 2,57 và khoảng tin cậy 95% của số giờ trung bình không bị đau đối với bệnh nhân viêm khớp là 3,3 ± 2,57 × 0,46 = 3,3 ±1,2 = 2,1 tới 4,5 giờ

Tính phi bình thường nghiêm trọng

Khi phân phối của dân số rất phi bình thường, ta có thể biến đổi thang đo của biến số x để cho nó có phân phối bình thường theo thang mới (xem Chương 19). Một cách khác là tính khoảng tin cậy phi tham số (Chương 20) mặc dù cách này khá phức tạp.

Tóm tắt các trường hợp Bảng 5.1 tóm tắt các cách xây dựng khoảng tin cậy. Không có ranh giới chính xác giữa tính bình thường và phi bình thường nhưng ta có thể cho phân phối hình J ngược (hình 2.6b) là cực kì phi bình thường nhưng phân phối bị lệch (Hình 2.5b và c) chỉ hơi phi bình thường.

Phán phäúi bçnh thæåìng

Phán phäúi t våïi 5 âäü tæû do

Page 28: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

24

Bảng 5.1 Các cách được đề nghị để xây dựng khoảng tin cậy

(a) Không biết độ lệch chuẩn dân số s Phân phối dân số Cỡ mẫu xấp xỉ bình thường rất phi bình thường Trên 60 x ± (z' × s/√ n) x ± (z' × s/√ n) Nhỏ hơn 60 x ± (t' × s/√ n) phi tham số

(b) Ðã biết độ lệch chuẩn dân số Phân phối dân số Cỡ mẫu xấp xỉ bình thường rất phi bình thường Trên 15 x ± (z' × σ /√ n) x ± (z' × σ /√ n) Nhỏ hơn 15 x ± (z' × σ /√ n) phi tham số

Page 29: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

KHOẢNG TIN CẬY CỦA TRUNG BÌNH

25

Trong các trường hợp hiếm người ta biết độ lệch chuẩn dân số và do đó không ước lượng từ dân số. Khi đó, điểm phần trăm được dùng để tính khoảng tin cậy bất kể cỡ mẫu, với điều kiện phân phối của dân số không được quá phi bình thường (trong trường hợp này xem lại đoạn trên).

Page 30: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

26

KIỂM ÐỊNH Ý NGHĨA CỦA MỘT TRUNG BÌNH

Giới thiệu Trong Chương 5 chúng ta đã biết làm sao để sử dụng trung bình và độ lệch chuẩn mẫu để xây dựng khoảng tin cậy thể hiện các giá trị khả dĩ của trung bình dân số. Trong chương này chúng ta mô tả cách ngược lại để xem trung bình mẫu có phù hợp với một giá trị trung bình dân số giả thuyết. Phương pháp đánh giá này được gọi là kiểm định ý nghĩa. Nó thường dựa vào phân phối t hay phân phối bình thường, yếu tố quyết định sự lựa chọn cũng giống như yếu tố quyết định trong việc tính toán khoảng tin cậy. Một dạng đặc biệt nhưng phổ biến của kiểm định t một mẫu, kiểm định t cặp đôi, sẽ được mô tả trước tiên, sau đó là dạng tổng quát của kiểm định t và cuối cùng là kiểm định bình thường một mẫu.

Kiểm định t cặp đôi Kiểm định t cặp đôi (paired t test) để kiểm định xem có sự khác nhau giữa một cặp biến số đo lường trên một cá nhân có bằng zero hay không, tính trên trung bình. Xem xét với một ví dụ cụ thể sẽ dễ dàng hơn. Xét- kết quả của một thử nghiệm lâm sàng kiẻm tra hiệu quả của thuốc ngủ trong đó người ta quan sát giấc ngủ của 10 bệnh nhân trong một đêm không dùng thuốc và một đêm có dùng thuốc. Kết quả được trình bày trong Bảng 6.1. Ðối với bệnh nhân. Người ta ghi nhận một cặp thời gian ngủ và tính hiệu số. Số trung bình của hiệu số số giờ ngủ có thuốc với số giờ ngủ dùng placebo là x=1,78 giờ, và độ lệch chuẩn là s=1,77 giờ. Sai số chuẩn là s/√n=1,77/√ 10=0,56 giờ.

Ngay cả khi thuốc không có tác dụng, thời gian ngủ trung bình khi có thuốc và khi dùng placebo sẽ không giống hệt nhau. Do đó có hai giải thích khả dĩ cho sự gia tăng mà ta vừa thấy. Thức nhất đó chỉ là do sự biến thiên tình cờ và nói chung thuốc và placebo gây ngủ như nhau. Cách giải thích thứ nhì là sự gia tăng thời gian ngủ là do tác dụng có thực của thuốc. Người ta dùng kiểm định ý nghĩa (significant test) để quyết định xem lời giải thích nào khả dĩ hơn.

Kiểm định bắt đầu bằng cách giả thuyết rằng giải thích đầu tiên là đúng. Bước đầu tiên do đó là định nghĩa giả thuyết trung tính (null hypothesis) khẳng định rằng không có sự khác biệt thực sự giữa thời gian ngủ khi có không hoặc khi có placebo, hay nói cách khác sự trung bình thực sự (µ) của hiệu số là zero. Bước tiếp theo là tính toán xác suất có được giá trị trung bình quan sát ( x) do sự biến thiên tình cờ nếu giả thuyết này đúng. Tìm được bằng cách tính xác suất có được hiệu số giờ ngủ lớn hơn hoặc bằng giá trị trung bình quan sát được. Xác suất này được gọi là mức ý nghĩa (significance level) của kết quả. Bác bỏ giả thuyết trung tính, nghĩa là bác bỏ sự giải thích là do tình cờ, khi xác suất này rất nhỏ.

Page 31: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

KIỂM ÐỊNH Ý NGHĨA CỦA MỘT TRUNG BÌNH

27

Bảng 6.1 Kết quả của thử nghiệm lâm sàng có đối chứng để xem hiệu quả của thuốc ngủ

Giờ ngủ Bệnh nhân thuốc placebo hiệu số 1 6,1 5,2 0,9 2 7,0 7,9 -0,9 3 8,2 3,9 4,3 4 7,6 4,7 2,9 5 6,5 5,3 1,2 6 8,4 5,5 3,0 7 6,9 4,2 2,7 8 6,7 6,1 0,6 9 7,4 3,8 3,6 10 5,8 6,3 -0,5 Trung bình 7,06 5,28 1,78

Chúng ta dùng phân phối t để tính mức ý nghĩa của kết quả. Từ Chương 5 chúng ta biết rằng với điều kiện là hiệu số giờ ngủ phân phối bình thường, ( x -µ )/(s/√ n) là giá trị của phân phối t có 9 bậc tự do. Giả thuyết không của hiệu số thời gian ngủ là zero tương đương với trung bình dân số, m, bằng zero và do đó.

1.., −== nfdxtns/

âäi càûp

Giá trị tuyệt đối của t càng lớn càng ít khả năng kết quả là do tình cờ (bỏ qua dấu của t). Trong thí dụ này, giá trị t tương ứng với hiệu số giờ ngủ là 1,78 là

t =1,78/0,56=3,18, độ tự do = 9

Ðiểm 5% (2 đuôi) của phân phối t với 9 độ tự do là 2,26 (Bảng A3), có nghĩa là có xác suất 5% giá trị t lớn hơn 2,26 về trị tuyệt đối. Ðiểm 2% là 2,82 và 1% là 3,25. Giá trị quan sát được ở giữa 2% và 1% (Hình 6.1). Hiệu số thời gian ngủ được xem là có mức ý nghĩa 2% (significant at the 2% level), bởi vì xác suất có sự khác biệt lớn đó là do tình cờ ít hơn 2%. Nếu viết xác suất theo thập phân người ta thường viết P<0,02. Bởi vì xác suất này nhỏ người ta kết luận rằng giả thuyết này là không phù hợp và thử nghiệm kết luận rằng thuốc có ảnh hưởng đến thời gian ngủ.

-2.82 0 2.82 -3.25 0 3.25 -3.18 0 3.18

(a) 2.82 laì âiãøm 2% (b) 3.25 laì âiãøm 1% 3

h

(c) 3.18 åí giæîa 2.82 vaì

.25 do âoï täøng diãûn têch ai bãn khoaíng tæì 1% âãún

2%

Page 32: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

28

Hình 6.1 Ýï nghĩa của giá trị 3,18 của phân phối t 9 độ tự do

Mức ý nghĩa càng nhỏ thì kết quả càng có ý nghĩa, bởi vì nó chứng minh chống lại giả thuyết trung tính mạnh mẽ hơn. Người ta thường xem xác suất dưới 5% là bằng chứng hữu lí để bác bỏ giả thuyết trung tính, xác suất dưới 1% là bằng chứng mạnh mẽ để bác bỏ giả thuyết trung tính ủng hộ sự kiện có tác động thực sự. Xác suất lớn hơn 5% được coi là không có ý nghĩa bởi vì nó thường được xem là tương đối phù hợp với giả thuyết không. Ðiều đó không có nghĩa là giả thuyết trung tính đúng mà chỉ là không có bằng chứng mạnh mẽ nào để bác bỏ chúng.

Trên lí thuyết có thể tính toán xác suất chính xác tương ứng với giá trị t = 3,18 và một vài chương trình máy tính đã làm như thế. Dù vậy, để làm bằng tay cần phải một bảng chi tiết (giống như Bảng A1 cho phân phối bình thường) cho mỗi độ tự do của phân phối t. Thông thường chỉ cần so sánh giá trị t với điểm phần trăm của độ tự do tương ứng.

Sau khi đã kết luận rằng thuốc có tác dụng thực sự chúng ta nên trình bày ước lượng của thời gian ngủ thêm do thuốc. Chúng ta thực hiện bằng cách tính 95% độ tin cậy. Ðó là 1,78 ± (2,26 × 0,56) bằng 0,51 tới 3,05 giờ.

Quan hệ giữa khoảng tin cậy và kiểm định ý nghĩa Có sự liên hệ chặt chẽ giữa ước lượng khoảng tin cậy và kiểm định ý nghĩa. Khoảng tin cậy cho phạm vi của giá trị trung bình dân số rút ra từ số liệu, trong khi kiểm định ý nghĩa đánh giá xem số liệu có phù hợp với một giá trị giả thuyết nào đó hay không. Do đó, nếu kết quả khác biệt có ý nghĩa với giá trị giả thuyết ở mức ý nghĩa đã chọn, khoảng tin cậy tương ứng sẽ không bao gồm giá trị này. Mặt khác, nếu giá trị không có ý nghĩa, khoảng tin cậy sẽ chứa giá trị giả thuyết. trong thí dụ trên, trung bình mẫu quan sát (1,78) khác biệt có ý nghĩa với zero ở mức 5%, và trong khoảng tin cậy 95% của trung bình dân số không chứa zero. Mặt khác, trung bình mẫu không khác biệt có ý nghĩa với zero ở mức 1% và khoảng tin cậy 95% của trung bình dân số (1,78 ± 3,25 × 0,56 = -0,04 tới 3,60) có chứa giá trị zero.

Kiểm định ý nghĩa 1 đuôi và 2 đuôi Kiểm định ý nghĩa được mô tả ở trên là hai đuôi (two-sided), bởi vì chúng ta cho phép đi khỏi giả thuyết trung tính theo 2 hướng. Chúng ta chỉ quan tâm đến giá trị tuyệt đối của t và không tính dấu của nó. giải thuyết trung tính cho rằng không có sự khác biệt giữa thuốc và placebo và giả thuyết thay thế là có sự khác nhau theo hai hướng (thuốc gây ngủ ít hay nhiều hơn placebo) là có thể và đều đáng quan tâm. Xác suất của cả hai trường hợp đều được xét đến trong tính toán mức ý nghĩa; khi đó ta dùng điểm phần trăm 2 đuôi của phân phối t.

Kiểm định một đuôi (one-sided)thích hợp nếu người ta xem xét thuốc sẽ gây ngủ nhiều hơn hoặc bằng placebo, nhưng không gây ngủ ít hơn. Nếu trường hợp này đúng, kết quả cho thấy thuốc gây ngủ trung bình ít hơn placebo sẽ được cho là do sự biến thiên tình cờ chứ không phải là tác dụng thực, dù rằng thời gian ngủ trung bình có lớn tới cỡ nào. Kiểm định ý nghĩa dựa trên đuôi trên của phân phối t và ta dùng điểm phần trăm 1 đuôi. Trong thí dụ này thuốc gây ngủ nhiều hơn 1,78 giờ và giá trị t là 3,18 với 9 độ tự do. Số này vượt quá điểm 1% một chiều, 2,68, và vì vậy nếu dùng kiểm định một đuôi nó có ý nghĩa ở mức 1% (lưu lý rằng 2,82 là điểm 2% hai đuôi và kiểm định có ý nghĩa ở mức 2% chứ không phải ở mức 1%).

Kiểm định hai đuôi thích hợp trong đa số các trường hợp. Kiểm định một đuôi có vẻ cám dỗ bởi vì có nhiều khả năng cho kết quả có ý nghĩa hơn nhưng nó có nguy cơ bác bỏ giả thuyết trung tính và kết luận một cách sai lầm là có tác động thực sự bác bỏ. Kiểm định một đuôi chỉ nên dùng khi có lí do rõ ràng. Ðiều này phải được quyết định trước khi thu thập số liệu và phải được khẳng định rõ ràng trong phần trình bày kết quả.

Page 33: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

KIỂM ÐỊNH Ý NGHĨA CỦA MỘT TRUNG BÌNH

29

Kiểm định t một mẫu Kiểm định t bắt cặp là một trường hợp đặc biệt của kiểm định t một mẫu, kiểm định xem trung bình mẫu có khác với một giá trị cho trước µ hay không, µ không nhất thiết phải bằng zero. Công thức tổng quát là

1..,/

−=−= nfdns

xt µ

Thí dụ 6.1

Dưới đây là chiều cao tính theo centimetre của 24 trẻ trai 2 tuổi người Jamaica mắc bệnh hồng cầu hình liềm đồng hợp tử

Theo tiêu chuẩn về chiều cao và trọng lượng của Anh, chiều cao tham khảo của trẻ trai 2 tuổi là 86,5 cm. Mẫu ở trên có chứng minh rằng trẻ trai bị bệnh hồng cầu liềm có chiều cao khác tiêu chuẩn hay không?

x=84,4 cm, s=3,11 cm , n=24, s/√ n=0,63 cm Giả thuyết trung tính là chiều cao trung bình của trẻ trai 2 tuổi bị bệnh hồng cầu liềm là 86,5 cm.

0.001P , <−=−=−=−= 1..,81,363.0

5.861.84/

5.86 nfdns

xt

Do đó chiều cao trung bình của các trẻ trai Jamaica bị bệnh hồng cầu liềm thấp hơn có ý nghĩa so với chiều cao tiêu chuẩn của Anh (P<0,001). Lưu ý rằng cần cẩn thận khi lí giải kết quả bởi vì sự phát triển của trẻ em bị hồng cầu liềm Jamaica được so sánh với tiêu chuẩn của Anh chứ không phải trẻ em Jamaica khỏe mạnh. Có thể rằng bệnh hồng cầu liềm làm còi sự phát triển nhưng cần phải so sánh với trẻ Jamaica không bệnh để khẳng định điều này. Phương pháp so sánh hai mẫu được trình bày ở Chương 7.

Kiểm định bình thường Trong trường hợp ước lượng khoảng tin cậy, khi kiểm định trung bình của một mẫu lớn (60 hay hơn 60) hay trong trường hợp đã biết độ lệch chuẩn của dân số, người ta dùng phân phối bình thường chứ không phải dùng phân phối t. Dạng kiểm định ý nghĩa thì hoàn toàn giống nhau

(Mẫu lớn) (đã biết σ)

nsxz/

µ−=

n

xt/σµ−=

84,4 89,9 89,0 91,9 87,0 78,5 84,1 86,3

80,6 80,0 81,3 86,8 83,4 89,8 85,4 80,6

85,0 82,5 80,7 84,3 85,4 85,0 85,5 81,9

Page 34: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

30

Dường như không có sự thống nhất trong việc đặt tên kiểm định này. Ðôi khi người ta gọi là kiểm định bình thường, hay kiểm định z hay kiểm định độ lệch bình thường chuẩn. Sách này dùng tên kiểm định bình thường.

Các loại sai lầm trong kiểm định giả thuyết Như đã nói, kiểm định ý nghĩa là phương pháp đánh giá xe, kết quả có thể là do tình cờ hay do một hiệu quả có thực. Nó không thể chứng minh điều này hoặc điều kia và một trong hai loại sai lầm trên có thể xảy ra. Giả thuyết trung tính có thể bị bác bỏ khi nó thực sự đúng (sai lầm loại I) hay ngược lại chúng ta có thể không bác bỏ được trong khi nó sai (sai lầm loại II) (Bảng 6.2)

Bảng 6.2 Các loại sai lầm trong kiểm định thống kê

Thực tế Kết luận của kiểm định ý nghĩa

giả thuyết trung tính đúng

giả thuyết trung tính sai

Bác bỏ giả thuyết trung tính

sai lầm loại I (xác suất=ý nghĩa)

kết luận đúng (xác suất=năng lực)

Không bác bỏ giả thuyết trung tính

kết luận đúng (xác suất = 1 - mức ý nghĩa)

sai lầm loại II (xác suất=1-năng lực)

Nhắc lại mức ý nghĩa của một kiểm định bằng với xác suất xảy ra kết quả bằng hoặc vượt quá giá trị quan sát được, nếu giả thuyết trung tính đúng. Xác suất chúng ta mắc sai lầm loại I và bác bỏ sai giả thuyết trung tính bằng mức ý nghĩa của kiểm định. Thí dụ, có xác suất 5% có kết quả có mức ý nghĩa 5% chỉ do sự biến thiên lấy mẫu đơn thuần và do đó nếu chúng ta đánh giá kết quả là bằng chứng bác bỏ giả thuyết trung tính, có xác suất 5% chúng ta sẽ mắc sai lầm (hình 6.2a).

Loại sai lầm thứ hai là không bác bỏ giả thuyết trung tính khi nó sai. Ðiều này xảy ra là do sự chồng lắp giữa phân phối lấy mẫu thực của trung bình mẫu quanh trung bình dân số µ' (≠µ ) và miền chấp nhận của giả thuyết trung tính dựa trên phân phối lấy mẫu giả thuyết về trung bình không đúng, µ . Ðiều này được minh họa trong Hình 6.2b. Miền gạch chéo cho thấy tỉ lệ b% của phân phối lấy mẫu thực sẽ rơi vào trong miền chấp nhận của giả thuyết trung tính, đó là chúng phù hợp với giả thuyết trung tính ở mức ý nghĩa 5%. Nếu chọn mức ý nghĩa thấp hơn, khiến xác suất sai lầm loại I nhỏ hơn, kích thước miền có gạch chéo tăng lên dẫn tới khả năng không bác bỏ được giả thuyết trung tính sẽ lớn hơn. Ðiều ngược lại cũng đúng. Xác suất ta không mắc sai lầm loại II là năng lực (power) của kiểm định. Ðiều này được thảo luận sâu hơn trong phần xác định cỡ mẫu ở Chương 26. Nói chunng tăng cỡ mẫu sẽ tăng năng lực bởi vì đường cong phân phối lấy mẫu trong hình 6.2b sẽ cao hơn và hẹp hơ và do đó sự chồng lắp sẽ giảm. (a)

Bác bỏ giả thuyết trung tính nếu trung bình mẫu ở vùng này

chấp nhận giả thuyết trung tính nếu trung bình mẫu ở

vùng này

bác bỏ giả thuyết trung tính nếu trung bình mẫu ở vùng này

Page 35: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

KIỂM ÐỊNH Ý NGHĨA CỦA MỘT TRUNG BÌNH

31

µ (a) Sai lầm loại I. Giả thuyết trung tính đúng. Trung bình dân số = m. Ðường cong cho thấy phân phối lấy mẫu của trung bình mẫu. Vùng gạch chéo (tổng số = 5%) cho thấy xác suất giả thuyết trung tính bị loại bỏ một cách sai lầm. (b)

Bác bỏ giả thuyết trung tính nếu trung bình mẫu ở vùng này

chấp nhận giả thuyết trung tính nếu trung bình mẫu ở vùng này

bác bỏ giả thuyết trung tính nếu trung bình mẫu ở vùng này

µ µ' (b) Sai lầm loại 2. Giả thuyết trung tính sai. Trung bình dân số = m' khác m. Ðường cong liên tục cho thấy phân phối lấy mẫu thực của trung bình mẫu, trong đó đường chấm là phân phối lấy mẫu theo giả thuyết trung tính. Vùng gạch chéo là xác suất (b%) giả thuyết trung tính không bị bác bỏ.

Hình 6.2 Xác suất xuất hiện hai loại sai lầm kiểm định ý nghĩa, minh họa ở kiểm định ở mức 5%

Page 36: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

32

SO SÁNH HAI TRUNG BÌNH

Giới thiệu Việc sử dụng kiểm định t và bình thường để so sánh một trung bình mẫu với một giá trị giả thuyết của trung bình dân số được trình bày ở Chương 6. Trong chương này chúng ta mô tả các sử dụng những kiểm định này để so sánh trung bình của hai mẫu khác nhau thí dụ trong lượng trung bình của trẻ em con những người hút thuốc lá nhiều và của trẻ em con những người không hút thuốc. Kiểm định này sử dụng những quy luật rất giống những quy luật trong trường hợp một mẫu và dạng của kiểm định thì giống nhau, cũng là lượng cần kiểm định chia cho sai số chuẩn của nó. Dù vậy không giống như trường hợp một mẫu, công thức cho kiểm t và bình thường khác nhau, bởi vì việc tính toán sai số chuẩn khác nhau và kiểm định t cần thêm một giả thiết khác đó là hai độ lệch chuẩn dân số bằng nhau. Ở dưới sẽ trình bày chi tiết. Khoảng tin cậy được tính như bình thường.

Cần phải lưu ý rằng kiểm định 2 mẫu không thích hợp cho việc so sánh hai trung bình của hai biến số đo lường trên cùng một mẫu. Trong trường hợp này cần tính hiệu số của mỗi cặp quan sát và dùng kiểm định cặp một mẫu như đã trình bày trong chương 6.

Phân phối lấy mẫu của hiệu số hai trung bình Hiệu số, (x1 - x2, của trung bình hai mẫu độc lập với nhau có phân phối bình thường với điều kiện mỗi trung bình có phân phối bình thường. trung bình của phân phối này là hiệu số giữa hai trung bình dân số, µ1 - µ2. Giả thuyết trung tính của kiểm định ý nghĩa là hai trung bình này bằng nhau nghĩa là µ1 - µ2=0. Công thức tính sai số chuẩn dựa trên sự kết hợp giữa hai sai số chuẩn của mỗi trung bình.

s.e.= √ (σ12/n1+σ2

2/n2)

Các sai số chuẩn này được ước lượng từ độ lệch chuẩn mẫu s1 và s2.

Kiểm định bình thường (mẫu lớn hay biết độ lệch chuẩn) Kiểm định bình thường được dùng khi mẫu lớn hoặc biết độ lệch chuẩn.

Mẫu lớn biết s

)//( 22

21

21

nsnsxxz+

−=

)//( 22

21

21

nnxxzσσ +

−=

Xem xét kết quả sau từ một chương trình sốt rét trong đó các lam máu của trẻ từ 1 đến 4 tuổi được xét nghiệm tìm kí sinh trùng Plasmodium falciparum. Kí sinh trùng được tìm thấy trong 70 lam máu, và nồng độ hemoglobin của những trẻ này là 10,6g% với độ lệch chuẩn là 1,4g%. Mức hemogloin của 80 trẻ khác là 11,5g% với độ lệch chuẩn là 1,3g%. điều này có phù hợp sự kiện nồng độ hemoglobin bị giảm trong lúc bị nhiễm P. falciparum? Bởi cả hai mẫu đều lớn nên có thể dùng kiểm định bình thường.

n1 = 70, x1 = 10,6, s1 =1,4

n2 = 80, x2 = 11,5, s2 = 1,3

Page 37: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

SO SÁNH HAI TRUNG BÌNH

33

001,0,06.480/3.170/4.1

5.116.1022

<−=+

−= Pz

Kết quả này có mức ý nghĩa ở 1% bởi vì 4,06 lớn hơn 3,29, điểm 0,1% của phân phối bình thường (Bảng A2). Do đó nồng độ hemoglobin trung bình của trẻ có P. Falciparum trong máu thấp hơn những trẻ không có P. falciparum một cách có ý nghĩa (P<0,001).

Khoảng tin cậy

Khoảng tin cậy được tính sử dụng z, điểm phần trăm thích hợp của phân phối bình thường. Khoảng tin cậy 95% của hiệu số giữa các nồng độ hemoglobin trung bình ở thí dụ trên là:

- 0,9 ± (1,96 × 0,2216) = -1,33 tới - 0,47 g%

Có nghĩa là trẻ có kí sinh trùng trong máu có hemoglobin trung bình thấp hơn từ 0,47 tới 1,33 g%.

Kiểm định t (mẫu nhỏ, độ lệch chuẩn bằng nhau) Kiểm định t được dùng cho mẫu nhỏ. Nó đòi hỏi phân phối dân số bình thường nhưng nó cũng vững đối với sự vi phạm giả thiết này, giống như trong trường hợp một mẫu. Khi so sánh hai trung bình, sự hợp lệ của test t cũng phụ thuộc vào hai độ lệch chuẩn dân số có bằng nhau hay không. Trong nhiều tình huống có thể giả thuyết chúng bằng nhau. Nếu độ lệch chuẩn mẫu rất khác nhau, thí dụ như lớn gấp đôi, cần phải sử dụng phương pháp khác. Ðiều này sẽ được nói ở dưới.

Công thức tính sai số chuẩn của sự khác biệt giữa hai trung bình được đơn giản thành

s.e. = √ (σ2/n1 + σ2/n2)= σ √ (1/n1 +1/n2)

Trong đó s là độ lệch chuẩn chung. Có hai ước lượng mẫu của s từ 2 mẫu, s1 và s2, và chúng kết hợp để cho một ước lượng của độ lệch chuẩn dân số chung, s, với độ tự do bằng (n1-1) + (n2-1) = n1+n2-2

−−

−+−=)2(

)1()1(

21

222

211

nnsnsns

Công thức này gán ước lượng từ mẫu lớn hơn trọng số (weight) lớn hơn bởi vì nó đáng tin cậy hơn. Sai số chuẩn của sự khác biệt của trung bình được ước lượng bằng

s.e. = s√ (1/n1 +1/n2)

Và giá trị t được tính

2..;/1/1 21

21

21 −+=+

−= nnfd

nnsxxt

Mẫu lớn biết s

c.i.=( x1- x2) ± (z' × s.e.)

c.i.=( x1- x2) ± (z' × s.e.)

s.e.= √ (s12/n1+s2

2/n2) s.e.= √ (σ12/n1+σ2

2/n2)

Page 38: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

34

Bảng 7.1 trình bày trọng lượng trẻ em của 15 người không hút thuốc lá và 14 hút thuốc lá nặng việc tính toán kiểm định t để so sánh hai nhóm như sau

kgs 4337.0)21415(

4927.0133707.014 22

=

−+×+×=

2721415..;42.21612.03904.0

14/115/14337.0)2029.35933.3( =−+===

+−= fdt

Từ bảng 3 có thể thấy 2,42 xấp xỉ bằng 2,47 điểm 2% của phân phối t với 27 độ tự do. Do đó trẻ trung bình con của người không hút thuốc nặng hơn của của người hút thuốc với mức ý nghĩa 2%

Khoảng tin cậy

c.i = ( x1 - x2) ± (t' × s.e.), s.e. = s√ (1/n1+1/n2)

Khoảng tin cậy được tính bằng cách dùng t, điểm phần trăm thích hợp của phân phối t với (n1 + n2 - 2) độ tự do. Trong thí dụ trên khoảng tin cậy 95% của sự khác biệt giữa trung bình trọng lượng lúc sinh là:

0,3904 ± (2,05 × 0,1612) = 0,06 tới 0,72 kg Có nghĩa là trẻ sinh ra do người mẹ không hút thuốc lá nặng hơn từ 0,06 tới 0,72 kg so với trẻ sinh từ người mẹ hút thuốc lá.

Bảng 7.1 So sánh trọng lượng lúc sinh của con 15 người không hút thuốc lá và trọng lượng lúc sinh của con 14 người hút thuốc lá nặng

Trọng lượng lúc sinh Không hút thuốc Hút thuốc lá nặng 3,99 3,18 3,79 2,84 3,60 2,90 3,73 3,27 3,21 3,85 3,60 3,52 4,08 3,23 3,61 2,76 3,83 3,60 3,31 3,75 4,13 3,59 3,26 3,63 3,54 2,38 3,51 2,34 2,71

x 3,5933 3,2029 s 0,3707 0,4927 n 15 14

Page 39: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

SO SÁNH HAI TRUNG BÌNH

35

Cỡ mẫu nhỏ, độ lệch chuẩn không bằng nhau Khi độ lệch chuẩn dân số của hai nhóm khác nhau, nên làm theo phương án thứ nhất nghĩa là tìm sự biến đổi thang đo để điều chỉnh (xem Chương 19), để cho có thể dùng kiểm định t. Thí dụ nếu dường như độ lệch chuẩn tỉ lệ với trung bình, có thể lấy logarithm của từng giá trị. Một phương án khác là dùng kiểm định phi tham số (xem Chương 20) hay dùng kiểm định Fisher-Behrens hay Welch (Armitage & Berry, 1987). ở đây không trình bày chi tiết những kiểm định này bởi vì chúng ít được sử dụng.

Page 40: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

36

SO SÁNH NHIỀU TRUNG BÌNH - PHÂN TÍCH PHƯƠNG SAI

Giới thiệu Thường có những tập hợp số liệu phức tạp chứa hơn hai nhóm và trong phân tích thường phải so sánh những trung bình của các nhóm thành phần. Thí dụ, người ta có thể muốn phân tích các số đo hemoglobin được thu thập trên một cuộc điều tra cộng đồng để xem nó có khác nhau theo tuổi và giới tính hay không và xem có phải là sự khác biệt giữa các nhóm tuổi là như nhau dù là nam hay nữ. Thoạt đầu, dường như có thể làm điều này bằng cách dùng một loạt các kiểm định t, so sánh từng 2 nhóm một. Ðiều này không chỉ rắc rối về mặt thực tiễn mà còn vô lí về mặt lí thuyết, bởi vì tiến hành một số lớn các kiểm định ý nghĩa có thể dẫn tới một kết quả có ý nghĩa sai lạc. Thí dụ có thể trông đợi 1 trong 20 (5%) các kiểm định được tiến hành sẽ có ý nghĩa ở mức 5% ngay cả khi không có sự khác biệt (xem lại thảo luận về sai lầm loại I trong chương 6).

Một phương pháp khác được gọi là phân tích phương sai (analysis of variance). Ý nghĩa của tên này được trình bày sau. Phương pháp khá phức tạp. Việc tính toán mất nhiều thời gian và thường được tiến hành nhờ các gói phần mềm máy tính chuẩn. Vì lí do này, chương này nhấn mạnh đến các nguyên lí với mục đích giúp người đọc có đủ kiến thức để chỉ định dạng phân tích cần thiết và lí giải kết quả. Dù vậy trong chương này cũng trình bày chi tiết của việc tính toán trong trường hợp đơn giản nhất, đó là phân tích phương sai một chiều, bởi vì nó sẽ giúp ích cho việc nắm vững căn bản của phương pháp và quan hệ của nó với kiểm định t.

Phân tích phương sai một chiều thích hợp khi các nhóm so sánh được xác bằng bởi một yếu tố (factor), thí dụ như so sánh trung bình giữa các giai cấp khác nhau hay giữa các dân tộc khác nhau. Phân tích phương sai hai chiều được mô tả và thích hợp khi việc chia nhóm dựa trên 2 yếu tố, thí dụ như tuổi và giới tính. Phương pháp dễ dàng được mở rộng để so sánh các nhóm đươc phân loại chéo bằng nhiều hai yếu tố.

Một yếu tố được phân tích phương sai bởi vì người ta muốn so sánh các mức khác nhau của nó hay bởi vì nó gây cho sự biến thiên cần loại trừ. Xem thí dụ sau. Sau khi khám phá tỉ suất bệnh mạch vành thay đổi đáng kể giữa các nhóm dân tộc khác nhau, người ta tiến hành một cuộc điều tra để xem điều này có phải là do nồng độ lipid trung bình khác nhau giữa các nhóm dân tộc khác nhau. Bởi vì nồng độ lipid thay đổi theo giới tính và tuổi, do đó cần phân tích phương sai của nhóm tuổi và giới tính cũng như nhóm dân tộc, mặc dù tuổi và giới tính không phải là mối quan tâm chính của nghiên cứu này. Việc đưa vào phân tích chúng có hai lợi ích. Thứ nhất, kiểm định ý nghĩa sự khác biệt giữa các nhóm chủng tộc trở nên mạnh mẽ (powerful) hơn, nghĩa là dễ khiến cho sự khác biệt thực sự trở thành có ý nghĩa. Thứ nhì, nó đảm bảo sự so sánh các nhóm chủng tộc không bị sai lệch do cơ cấu nhóm tuổi và giới tính (xem thảo luận về biến số gây nhiễu ở Chương 14. Xem thêm phương pháp chuẩn hóa ở Chương 15 được dùng để trình bày trung bình của các nhóm dân tộc được hiệu chỉnh theo tuổi và giới tính).

Cũng có thể phân tích số liệu được phân thành nhiều yếu tố bằng cách dùng một kĩ thuật tương tự nhưng tổng quát hơn gọi là hồi quy bội (multiple regression) được mô tả ở Chương 10. Cả hai phương pháp đều cho kết quả giống hệt nhau nhưng bởi vì hồi quy bội tổng quát hơn nên nó cần tính toán phức tạp hơn. Vì thế nó không hiệu quả trong các trường hợp đơn giản. Dù vậy, sự lựa chọn phụ thuộc vào chương trình máy tính có được và chúng có dễ sử dụng hay không.

Một vài độc giả có thể thấy nội dung của chương này hơi khó. Nó có thể bỏ qua trong lần đọc đầu.

Page 41: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

SO SÁNH NHIỀU TRUNG BÌNH - PHÂN TÍCH PHƯƠNG SAI

37

Phân tích phương sai một chiều Phân tích phương sai một chiều (one-way analysis of variance) được dùng để so sánh trung bình của một số nhóm, thí dụ nhưng nồng độ hemoglobin trung bình của bệnh nhân của các loại bệnh hồng cầu liềm khác nhau (bảng 8.1a). Phương pháp phân tích được gọi là một chiều bởi vì số liệu được phân tích theo một chiều, trong trường hợp này là loại bệnh hồng cầu liềm. Phương pháp dựa trên việc xác định thành phần trong toàn bộ biến thiên được quy cho sự khác biệt giữa các trung bình nhóm và so sánh chúng với thành phần có thể quy cho sự khác biệt giữa các cá nhân trong cùng nhóm. Do đó nó có tên là phân tích phương sai.

Chúng ta bắt đầu bằng cách tính phương sai của tất cả các quan sát, bỏ qua việc chia thành từng nhóm. Nhớ lại trong Chương 3 rằng phương sai là bình phương của độ lệch chuẩn và bằng tổng bình phương các hiệu số của quan sát và trung bình, chia cho độ tự do. Phương pháp phân tích phương sai một chiều chia tổng các bình phương (sum of square - SS) thành 2 phần riêng biệt:

(i) Tổng các bình phương do sự khác biệt giữa các trung bình nhóm

(ii) Tổng cách bình phương do sự khác biệt giữa các quan sát trong từng nhóm nó được gọi là tổng bình phương phần dư (residual sum of squares)

Tổng các độ tự do cũng được tách ra theo cách tương tự. Việc tính toán số liệu hồng cầu liềm được trình bày ở bảng 8.1(b) và kết quả trình bày của bảng phân tích phương sai ở trong bảng 8.1(c).

Cột thứ tư trong bảng trình bày lượng biến thiên cho mỗi độ tự do và được gọi là trung bình bình phương (mean square - MS). Kiểm định ý nghĩa cho sự khác biệt giữa các nhóm dựa trên trung bình bình phương giữa các nhóm (between groups) và trong nội bộ các nhóm (within groups). Nếu sự khác biệt quan sát được trong nồng độ hemoglobin của các loại bệnh hồng cầu liềm khác nhau chỉ là tình cờ, sự biến thiên giữa các nhóm cũng tương đương với sự biến thiên giữa các đối tượng trong cùng một loại bệnh. Ngược lại nếu chúng là do sự khác biệt thực sự thì sự biến thiên giữa các nhóm sẽ lớn hơn. Trung bình bình phương được so sánh bằng kiểm định F, đôi khi còn được gọi là kiểm định tỉ số phương sai (variance-ratio). Trong đó N là tổng số các quan sát và k là số các nhóm.

F phải xấp xỉ bằng 1 nếu không có sự khác biệt thực sự giữa các nhóm và lớn hơn 1 nếu có sự khác biệt. Theo giả thuyết trung tính cho rằng sự khác biệt chỉ là do tình cờ, tỉ số này sẽ tuân theo phân phối F mà không giống với các phân phối khác, nó có một cặp độ tự do: (k-1) độ tự do ở tử số và (N-k) độ tự do ở mẫu số. Ðiểm phần trăm của phân phối F được lập bảng theo các cặp độ tự do ở Bảng A4. Cột của bảng chỉ độ tự do của tử số và các khối gồm nhiều hàng chỉ độ tự do của mẫu số. trong mỗi khối này có những hàng khác nhau cho mức phần trăm khác nhau. Ðiểm phần trăm là một đuôi bởi vì kiểm định dựa trên phân phối F lớn hơn một.

Trong bảng 8.1(c), F=50,26/0,95=52,9 với độ tự do (2,38). Bảng điểm phần trăm có hàng cho 30 và 40 độ tự do chứ không có hàng cho 38 độ tự do. Dù vậy chúng ta có thể nói rằng điểm 0,1% của F(2,38) ở giữa 8,77 và 8,25 (là điểm 0,1% của F(2,30) và F(2,40)). Rõ ràng 52,9 lớn hơn cả hai. Do đó nồng độ hemoglobin khác nhau một cách có ý nghĩa giữa các bệnh nhân mắc các loại bệnh hồng cầu liềm khác nhau (P<0,001). Nồng độ trung bình thấp nhất là bênh nhân có Hb SS, trung bình đối với bệnh nhân có Hb S/ß-thalassaemia và cao nhất đối với bệnh nhân có Hb SC.

Giả thiết

Có hai giả thiết cần cho kiểm định F. Thứ nhất là số liệu phải phân phối bình thường. Thứ nhì là độ lệch chuẩn giữa các cá thể trong cùng một nhóm phải giống nhau. Có thể ước lượng bằng căn bậc hai của trung bình bình phương (MS) trong các nhóm. Có thể bỏ qua sự phân

Page 42: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

38

phối không bình thường nhưng các độ lệch chuẩn không bằng nhau có thể gây hậu quả nghiêm trọng. Trong trường hợp này có thể biến đổi số liệu.

Mối liên hệ với kiểm định t hai mẫu

Phân tích phương sai một chiều là sự mở rộng của kiểm định t hai mẫu. Khi chỉ có hai mẫu, nó cho kết quả y như là kiểm định t. Giá trị F bằng bình phương giá trị t tương ứng và điểm phần trăm của phân phối F với (1,N-2) độ tự do cũng bằng bình phương của điểm phần trăm của phân phối t với N-2 độ tự do.

Page 43: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

SO SÁNH NHIỀU TRUNG BÌNH - PHÂN TÍCH PHƯƠNG SAI

39

Phân tích phương sai hai chiều Người ta dùng phân tích phương sai hai chiều (two way analysis of variance) khi số liệu được phân loại theo hai chiều thí dụ như theo tuổi và giới tính. Số liệu là quy hoạch cân đối (balanced design) nếu số các quan sát trong các nhóm là bằng nhau và quy hoạch không cân đối (unbalanced design) nếu số các quan sát trong các nhóm không bằng nhau. Qui hoạch cân đối có hai loại có lặp (with replication) nếu có nhiều quan sát trong mỗi nhóm và không có lặp (without replication) nếu chỉ có một quan sát. Ba loại quy hoạch này sẽ được trình bày riêng.

Bảng 8.1 Phân tích phương sai một chiều: sự khác biệt trong nồng độ hemoglobin giữa các bệnh nhân bị các loại bệnh hồng cầu liềm khác nhau. Số liệu từ Anionwo et al. (1981) British Medical Journal, 282, 283-6

(a) Số liệu Loại bệnh hồng cầu liềm

Số bệnh nhân (n

i)

Trung bình

( xi)

s.d.

(si)

Giá trị của các cá thể hemoglobin g%

(x)

Hb SS 16 8,7125 0,8445 7,2, 7,7, 8,0, 8,1, 8,3, 8,4, 8,4, 8,5, 8,6, 8,7, 9,1, 9,1, 9,1, 9,8, 10,1, 10,3

Hb S/b-thalassaemia 10 10,6300 1,2841 8,1, 9,2, 10,0, 10,4, 10,6, 10,9, 11,1, 11,9, 12,0, 12,1

Hb SC 15 13,300 0,9419 10,7, 11,3, 11,5, 11,6, 11,7, 11,8, 12,0, 12,1, 12,3, 12,6, 12,6, 13,3, 13,8, 13,8, 13,9

(b) Tính toán _____________________________________________________________________________ N = Σ ni = 16 + 10 + 15 = 41, số nhóm (k) = 3 Σ x = 7,2 + 7,7 + ... + 13,8 + 13,9 = 430,2 Σ x2= 7,22 + 7,72 + ... + 13,82 + 13,92 = 4651,80 Tổng cộng: SS = Σ (x- x)2 = Σ x2 - (Σ x)2/N = 4651,80 - 430,22/41=137,85 d.f.= N-1 = 40 Giữa các nhóm SS= Σ ni( xi- x)2= Σ nixi

2-( Σ x)2/N = 16 × 8,71252+10 × 10,63002+15 × 12,3002 - 430,22/41=99,89 d.f. = k-1 = 2 Trong các nhóm SS = Σ (ni -1)si

2 =15 x 0,84452 + 9 x 1,28412 + 14 x 0,9419 = 37,96 d.f.= N - k = 41-3 = 38 (c) Phân tích phương sai

Nguồn biến thiên SS d.f. MS=SS/d.f. MS giữa các nhóm F= ----------------------------

MS bên trong nhóm Giữa các nhóm 99,89 2 50,26 52,9,P<0,001 Trong các nhóm 37,96 38 0,95

Tổng cộng 137,85 40

Page 44: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

40

Quy hoạch cân đối có lặp Bảng 8.2 trình bày kết quả thực nghiệm trên 3 chủng chuột mỗi chủng gồm 5 chuột đực và 5 chuột cái được điều trị bằng hormone tăng trưởng. Mục đích là tìm xem các chủng chuột và giới tính chuột có đáp ứng với điều trị như nhau hay không. Số đo của đáp ứng là tăng trọng sau 7 ngày.

Những số liệu này được phân loại theo hai chiều, bởi chủng tộc và giới tính. Quy hoạch là cân đối có lặp (balanced with replication) bởi vì có 5 quan sát trong mỗi nhóm chủng-giới tính. Phân tích phương sai 2 chiều chia tổng bình phương thành 4 thành phần

(i) Tổng bình phương do sự khác biệt giữa các chủng. Ðiều này là tác động chính (main effect) của yếu tó, chủng. Ðộ tự do của nó là số các chủng chuột trừ một và bằng 2.

(ii) Tổng bình phương do sự khác biệt giới tính, đó là tác động chính của giới tính. Ðộ tự do của nó bằng 1, bằng số các giới tính trừ một.

(iii) Tổng bình phương do sự tương tác (interaction) giữa chủng và giới tính. Sự tương tác có nghĩa là sự khác biệt do chủng không giống nhau trên cả hai giới hay ngược lại sự khác biệt do giới tính không giống nhau trên 3 chủng chuột. Ðộ tự do bằng tích số độ tự do của 2 tác động chính bằng 2 × 1=1

(iv) tổng bình phương phần dư là sự khác biệt giữa các con chuột trong cùng nhóm chủng-giới tính. Ðộ tự do bằng 24, tích số của số chủng (3) số giới tính (2) và số quan sát trong mỗi nhóm trừ một (4).

Tác động chính và tương tác được kiểm định độ ý nghĩa bằng cách dùng kiểm định F để so sánh trung bình bình phương của nó với trung bình bình phương phần dư như được mô tả trong phân tích phương sai một chiều. Thực nghiệm này không thu được kết quả có ý nghĩa.

Quy hoạch cân đối không lặp Năm phương pháp để xác định tuổi thai được so sánh trên 10 phụ nữ trong bảng 8.3. Không có tổng bình phương phần dư trong phân tích phương sai bởi vì chỉ có một quan sát cho một

Bảng 8.2 Sự khác biệt đáp ứng với hormone sinh trưởng trên 3 chủng chuột khác nhau (mỗi chủng gồm 5 đực và 5 cái).

(a) Tăng trọng trung bình (tính theo gram) với độ lệch chuẩn ở trong ngoặc (n=5 trong mỗi nhóm), Giới tính chủng A chủng B chủng C Nam 11,9(0,9) 12,1(0,7) 12,2(0,7) Nữ 12,3(1,1) 11,8(0,6) 13,1(0,9) (b)Phân tích phương sai hai chiều: quy hoạch cân bằng có lặp Nguồn biến thiên SS d.f. MS=SS/

d.f. MS tác động

F= ---------------------- MS phần dư

Tác động chính Chủng 2,63 2 1,32 1,9,P>0,1 Giới tính 1,16 1 1,16 1,7,P>0,1 Tương tác Chủng × Giới

1,65

2

0,83

1,2,>0,1

Phần dư 16,86 24 0,70 Tổng cộng 22,30 29

Page 45: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

SO SÁNH NHIỀU TRUNG BÌNH - PHÂN TÍCH PHƯƠNG SAI

41

phương pháp áp dụng trên một phụ nữ. Trong trường hợp như vậy, tương tác được giả thiết là do sự biến thiên tình cờ và trung bình bình phương được dùng làm ước lượng trung bình bình phương phần dư để tính giá trị F của tác động chính. Tác động chính do tuổi thai khác nhau giữa 10 phụ nữ hiển nhiên có ý nghĩa. Bản thân điều này không được quan tâm lắm nhưng nó là một nguồn biến thiên quan trọng cần phải tính đến trong khi so sánh các phương pháp. Tác động chính do sự khác biệt giữa các phương pháp là có ý nghĩa ở mức 5% (F=757,85/202,81= 3,74, d.f.=[4,36]).

Phân chia tổng bình phương

Cần xem xét chi tiết các hiệu số tạo nên tác động có ý nghĩa. Thí dụ, phương pháp dựa trên ngày thai máy cho con số trung bình cao hơn đáng kể so với các phương pháp khác. Có thể phân chia tổng bình phương của tác động chính đối với các phương pháp trong bảng 8.3 (c) thành:

(i) Tổng bình phương các hiệu số giữa phương pháp dựa trên ngày thai máy và các phương pháp khác. Tổng này có 1 độ tự do.

Ðối tượng LMP VE DOQ US DAO 1 275 273 288 273 244 270,6 2 292 283 284 285 329 294,6 3 281 274 298 270 252 275,0 4 284 275 271 272 258 272,0 5 285 294 307 278 275 287,8 6 283 279 301 276 279 283,6 7 290 265 298 291 295 287,8 8 294 277 295 290 271 285,4 9 300 304 293 279 271 289,4 10 284 297 352 292 284 301,8 Trung bình 286,4 282,1 298,7 280,6 275,8

Bảng 8.3 Tuổi thai tính theo ngày của 10 phụ nữ được ước tính bằng 5 phương pháp - kì kinh cuối (last mentrual period - LMP), khám âm đạo (Vaginal examination - VE), ngày thai máy (date of quickening - DOQ), siêu âm (Ultra sound - US) và oxydase diamine máu (Diamine oxidase - DAO).

(a) số liệu

Page 46: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

42

(ii) Tổng bình phương còn lại có 3 độ tự do, thể hiện các hiệu số trong số 4 phương pháp khác (LMP, VE, US, DAO).

Mỗi thành phần được kiểm định bằng kiểm định F theo cách bình thường. Sự phân chia này cho thấy phương pháp dựa trên ngày thai máy khác đáng kể (P<0,001) với các phương pháp khác, nhưng không có sự khác biệt có ý nghĩa trong 4 phương pháp này.

Lưu ý rằng tổng bình phương đã được chia theo các phương pháp khác nhau, và thành các thành phần độc lập bằng độ tự do, trong trường hợp này là 4. Sự phân chia phụ thuộc vào sự so sánh quan tâm và tốt nhất phải được dựa trên nền tảng tiên nghiệm (a priori) trước khi phân tích số liệu. Tiến hành phân chia nhờ phương pháp tương phản tuyến tính (method of linear contrasts). Người đọc có thể tham khảo Armitage & Berry (1987) để biết rõ chi tiết.

Quan hệ với kiểm định t một mẫu

Phương pháp phân tích phương sai hai chiều quy hoạch cân đối không có lặp là mở rộng của kiểm định t bắt cặp một mẫu, so sánh các giá trị của nhiều biến được đo lường trên một cá thể. Trong trường hợp này, có 5 biến: tuổi thai được ước tính bằng các phương pháp khác nhau trên một phụ nữ. Hai cách tiếp cận cho kết quả tương tự khi chỉ có 2 biến và giá trị F bằng giá trị t bình phương.

Quy hoạch không cân đối Bảng 8.4(a) tóm tắt số liệu về nhiễm giun móc và mức hemoglobin, được thu thập trong một cuộc điều tra về nhiễm kí sinh trùng ở Ðông châu Phi. Số liệu được phân loại theo hai yếu tố, giới tính và mật độ nhiễm giun móc. Có thể thấy rằng đối với mỗi giới tính, nồng độ hemoglobin giảm khi nhiễm giun móc càng nhiều, và đối với một mức độ nhiễm giun móc, hemoglobin trung bình ở nữ thấp hơn ở nam. Dù vậy quy hoạch này là không cân đối bởi vì số người trong mỗi nhóm không bằng nhau. Ðiều này có nghĩa là không thể tách tác động của giới tính và mật độ nhiễm giun khiến cho việc lí giải số liệu không thể tiến hành trực tiếp.

(b) Phân tích phương sai hai chiều: quy hoạch cân đối không có lặp (trung bình bình phương tương tác được dùng làm ước lượng trung bình bình phương phần dư trong kiểm định F)

Nguồn biến thiên SS d.f. MS=SS/d.f.

MS tác động F= -------------------------

MS tương tác

Ðối tượng 4437,6 9 493,07 2,43, P<0,05 Phương pháp 3031,4 4 757,85 3,74, P<0,05 Tương tác 7301,0 36 202,81 Tổng cộng 14770,0 49 (c) Phân chia tổng bình phương theo phương pháp Nguồn biến thiên SS d.f. MS=SS/d.f.

MS tác động

F= ------------------------- MS tương tác

DOQ so với các phương pháp khác 2415,1 1 2415,10 11,91,P<0,001 Khác biệt giữa LMP, VE, US và DAO 616,3 3 205,43 1,01,P>0,1 Kĩ thuật 3031,4 4

Page 47: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

SO SÁNH NHIỀU TRUNG BÌNH - PHÂN TÍCH PHƯƠNG SAI

43

Tổng bình phương không thể chia thành các thành phần quy về 2 yếu tố độc lập với nhau và trong bảng 8.4(b) trình bày phân tích phương sai được cải tiến. Ðầu tiên tính tổng bình phương do sự khác biệt giới tính. Trừ khi hai giới tính có phân phối giun móc giống nhau, tổng bình phương sẽ gồm cả một số biến thiên do sự khác biệt mật độ giun. Sau đó tính tổng bình phương do mật độ nhiễm giun. Tổng này đánh giá quan hệ giữa nồng độ hemoglobin và mật độ nhiễm giun có điều chỉnh cho sự khác biệt giới tính giữa các nhóm mật độ nhiễm giun. Cả hai tác động chính đều có ý nghĩa, mức ý nghĩa 1% đối với giới tính (F=9,9, d.f.=[1,153]) và 0,1% đối với mật độ nhiễm giun (F=27,8, d.f=[3,153]). Sự tương tác không có ý nghĩa.

Theo phương án khác, tác động của nhiễm giun móc được phân tích phương sai trước, trong trường hợp đó nó gồm cả sự biến thiên do khác biệt nồng độ hemoglobin giữa nam và nữ. Sau đó tác động chính của giới tính sẽ là sự khác biệt còn lại sau khi điều chỉnh cho sự khác biệt mật độ giun giữa nam và nữ. Ðối với quy hoạch không cân bằng cần tiến hành phân tích theo cả hai cách. Dù vậy, trong thí dụ này, sự xem xét đã dẫn đến rằng nên tính tới giới tính trước.

Số liệu không cân đối phổ biến và không thể tránh được trong cuộc nghiên cứu điều tra. Dù vậy, thử nghiệm lâm sàng và thực nghiệm labo nên dự trù để có quy hoạch cân đối. Không phải mọi dự trù đều thành công thí dụ như có người rời khỏi vùng trong khi thử nghiệm. Các chương trình phân tích phương sai của các phần mềm máy tính nhỏ có thể dùng cho các quy hoạch cân đối hay quy hoạch chỉ có một số nhỏ các giá trị bị khuyết (missing value); trong những trường hợp này các chương trình hồi quy bội có thể dùng cho thiết kế không cân đối (xem Chương 10).

Tác động cố định và ngẫu nhiên Yếu tố có thể chia làm hai loại, tác động cố định (phổ biến hơn) và tác động ngẫu nhiên. Các yếu tó như giới tính, nhóm tuổi, và loại bệnh hồng cầu liềm là các tác động cố định (fixed effects) bởi vì các mức riêng lẻ của nó có các giá trị nhất định; giới tính luôn luôn là nam hay nữ. Ngược lại, các mức riêng lẻ của của tác động ngẫu nhiên (random effects) không được sự quan tâm mà chỉ là một mẫu đại diện cho sự biến thiên. Thí dụ, xét một nghiên cứu điều tra sự biến thiên natri và sucrose trong dung dịch ORS được pha ở nhà, trong đó có

Bảng 8.4 Nồng độ hemoglobin (g%) theo mật độ nhiễm giun móc ở nam và nữ

(a) Số liệu

Nam Nữ Mật độ nhiễm giun móc Số Hb trung

bình s.d. Số Hb trung

bình s.d.

Âm tính 22 12,3 1,8 35 11,1 1.1 Thấp 20 11,9 1,2 27 10,8 1,3

Trung bình 17 10,7 1,6 14 9,5 1,9 Cao 15 9,0 1,4 11 8,6 1,7

(b) Phân tích phương sai hai chiều: quy hoạch không cân đối

Nguồn biến thiên SS d.f. MS=SS/d.f. MS tác động F= ----------------------

MS phần dư Giới tính 20,94 1 20,94 9,9,P<0,01 Mật độ giun móc điều chỉnh theo giới 176,68 3 58,89 27,8, P<0,001 Tương tác 3,24 3 1,08 0,5, P>0,1 Phần dư 324,28 153 2,12 Tổng cộng 525,14 160

Page 48: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

44

10 người được đề nghị từng người pha 8 dung dịch. Trong trường hợp này 10 người chỉ là đại diện cho nguồn biến thiên giữa các dung dịch được pha bởi những người khác nhau. Con người là một tác động ngẫu nhiên. Trong thí dụ này và để xem tác động con người có ý nghĩa không, chúng ta sẽ quan tâm đến việc ước lượng độ lớn của sự biến thiên nồng độ giữa các dung dịch được pha bởi một người và sự biến thiên giữa các dung dịch được pha bởi các người khác nhau. Chúng được gọi làì thành phần của sự biến thiên (components of variation). Xem Huitson để biết cách ước lượng chúng.

Phương pháp kiểm định ý nghĩa giống nhau trong tác động cố định và ngẫu nhiên trong quy hoạch một chiều và trong quy hoạch hai chiều không có lặp, nhưng không giống nhau trong quy hoạch hai chiều (hay nhiều chiều hơn) có lặp. Trong quy hoạch hai chiều có lặp, nếu cả hai tác động đều cố định, trung bình bình phương được so sánh với trung bình bình phương phần dư như đã nói ở trên. Mặt khác nếu cả hai tác động đều là ngẫu nhiên, trung bình bình phương được so sánh với trung bình bình phương tương tác chứ không phải với trung bình bình phương phần dư. Nếu một tác động là ngẫu nhiên và một là cố định, nó sẽ là cách khác: tác động ngẫu nhiên được so sánh với trung bình bình phương phần dư, và tác động cố định sẽ đươc so sánh với trung bình bình phương tương tác. Ðây là những điểm phức tạp. Người đọc quan tâm nhiều đến chi tiết nên tham khảo Huitson (1980).

Page 49: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

TƯƠNG QUAN VÀ HỒI QUY TUYẾN TÍNH

45

TƯƠNG QUAN VÀ HỒI QUY TUYẾN TÍNH

Giới thiệu Các chương trước chú trọng đến phân tích và so sánh trung bình của một biến. Bây giờ đến lượt chúng ta chú ý đến quan hệ giữa các biến khác nhau và trong chương này chú ý đến kĩ thuật tương quan và hồi quy tuyến tính để tìm hiểu mối quan hệ tuyến tính (linear) giữa hai biến liên tục. Tương quan (correlation) đó lường sự chặt chẽ của mối liên hệ trong khi hồi quy tuyến tính (linear regression) cho biết phương trình đường thẳng mô tả sự liên hệ tốt nhất và cho phép tiên đoán biến số này từ biến số khác.

Bảng 9.1 Thể tích huyết tương và trọng lượng cơ thể của 8 người đàn ông khỏe mạnh

Ðối tượng trọng lượng cơ thể (kg) Thể tích huyết tương (lít)

1 58,0 2,75 2 70,0 2,86 3 74,0 3,37 4 63,5 2,76 5 62,0 2,62 6 70,5 3,49 7 71,0 3,05 8 66,0 3,12

2,5

2,7

2,9

3,1

3,3

3,5

55 60 65 70 75

troüng læåüng cå thãøtroüng læåüng cå thãøtroüng læåüng cå thãøtroüng læåüng cå thãø

thãø

têch

huyã

út tæå

ngth

ãø têc

h hu

yãút t

æång

thãø

têch

huyã

út tæå

ngth

ãø têc

h hu

yãút t

æång

Hình 9.1 Phân tán đồ của thể tích huyết tương và trọng lượng cơ thể cùng với đường hồi quy tuyến tính

Tương quan Bảng 9.1 trình bày trọng lượng cơ thể và thể tích huyết tương của 8 người đàn ông khỏe mạnh. Phân tán đồ (scatter diagram) của những số liệu này (hình 9.1) cho thấy thể tích huyết tương lớn có liên quan đến trọng lượng cơ thể cao và ngược lại. Sự liên quan này được đo lường bằng hệ số tương quan (correllation coefficient), r.

22 )()())((yyxx

yyxxr−∑−∑

−−∑=

Page 50: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

46

Trong đó x là trọng lượng, y thể tích huyết tương, x và (y là trung bình tương ứng. Phân tán đồ minh họa những hệ số tương quan khác nhau đươc trình bày trong hình 9.2. Hệ số tương quan luôn luôn là một số giữa -1 và +1 và bằng zero nếu hai biến không liên hệ. Nó dương nếu x và y cùng cao hay cùng thấp và càng lớn khi sự liên quan càng chặt. Ta có giá trị 1 nếu các điểm trên phân tán đồ nằm ngay trên đường thẳng. Ngược lại, hệ số tương quan âm nếu giá trị y cao gắn liền với giá trị x thấp và ngược lại.

Ðiều quan trọng là sự tương quan giữa hai biến số cho thấy sự liên hệ nhưng không nhất thiết có nghĩa là cá quan hệ 'nhân quả'. Xem thảo luận đầy đủ hơn ở Bradford Hill (1977).

Hệ sốï tương quan được tính dễ dàng hơn bằng cách lưu ý:

Σ (x- x)(y- y)=Σ xy- (Σ x)(Σ y)/n Σ (x- x)2=Σ x2-(Σ x)2/n Σ (y-y)2=Σ y2-(Σ y)2/n

Trong thí dụ này

N= 8 Σ x =535 x = 66,835 Σ x2 = 35983,5

–– –

(a) Không tương quan

–––

––––

(b) Tương quan dương không hoàn toàn

(c) Tương quan dương hoàn toàn

–––

––––

(d) Tương quan âm không hoàn toàn

(e) Tương quan âm hoàn toàn

Hình 9.2 phân tán đồ minh họa các giá trị khác nhau của hê số tương quan. Trong đây cũng có các đường hồi quy.

Page 51: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

TƯƠNG QUAN VÀ HỒI QUY TUYẾN TÍNH

47

Σ y=24,2 y = 3,0025 Σ y2= 72,7980 Σ xy=58,0 × 2,75 + 70,0 × 2,86 +...+ 66,0 × 3,12 =1615,295

Do đó

Σ (x- x)(y- y) = 1616,295 - 535 × 24,02/8=8,96 Σ (x-x)2 = 35983,5 - 5352/8=205,38 Σ (y- y)2 = 72,798 - 24,022/8=0,6780

r= 8,96/( 205,38 × 0,6780)=0,76 Kiểm định ý nghĩa

Kiểm định t được dùng để xem r có khác zero một cách có ý nghĩa hay không hay nói cách khác có phải sự tương quan quan sát được chỉ là do tình cờ hay không

2..,1

22 −=

−−= nfdr

nrt

Trong thí dụ này:

6..,86.276.012876.0 2 ==

−−= fdt

Ðiều này có ý nghĩa ở mức 5% xác nhận ý nghĩa của sự liên hệ giữa thể tích huyết tương và trọng lượng cơ thể

Mức ý nghĩa phụ thuộc của cả vào độ lớn của mối tương quan và số các quan sát. Lưu ý rằng tương quan yếu có thể có ý nghĩa thống kê nếu nó dựa trên một số lớn quan sát, trong khi sự tương quan mạnh có thể không đạt được mức ý nghĩa nếu chỉ có một ít quan sát.

Hồi quy tuyến tính Hồi quy tuyến tính cho phương trình đường thẳng mô tả nếu biến x tăng thì biến y tăng như thế nào. Không giống như tương quan, việc lựa chọn biến nào để làm biến y là quan trọng bởi vì hai phương pháp không cùng cho một kết quả, y thường được gọi là biến số phụ thuộc (dependent variable) và x là biến số độc lập hay giải thích (independent or explanatory variable). Trong thí dụ này, rõ ràng chúng ta cần quan tâm sự phụ thuộc thể tích huyết tương và trọng lượng cơ thể.

Phương trình hồi quy là

y = a + bx

Trong đó a là điểm chặn (intercept) và b là độ dốc (slope) của đường thẳng (Hình 9.3). Giá trị đối với a và b được tính sao cho cực tiểu hóa bình phương khoảng cách theo chiều đứng từ các điểm số liệu tới đường thẳng. Nó được gọi là phù hợp bình phương tối thiểu (least squares fit) (Hình 9.4). Ðộ dốc b đôi khi được gọi là hệ số hồi quy (regression coefficient). Nó có cùng dấu với hệ số tương quan. Khi không có sự tương quan, b bằng zero, tương ứng với một đường thẳng hồi quy nằm ngang đi qua điểm y.

ĉ và a = (y - b(x

Page 52: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

48

a

y

x

1

b

Hình 9.3 Giao điểm và độ dốc của phương trình hồi quy y = a + bx. Giao điểm a là điểm mà đường thẳng cắt trục y và cho giá trị y ở x = 0. Ðộ dốc b là mức tăng của y tương ứng với sự gia tăng một đơn vị của x.

2,5

2,7

2,9

3,1

3,3

3,5

55 60 65 70 75

troüng læåüng cå thãøtroüng læåüng cå thãøtroüng læåüng cå thãøtroüng læåüng cå thãø

thãø

têch

huyã

út tæå

ngth

ãø têc

h hu

yãút t

æång

thãø

têch

huyã

út tæå

ngth

ãø têc

h hu

yãút t

æång

Hình 9.4 Ðường thẳng hồi quy tuyến tính, y = a + bx, được làm phù hợp bằng bình phương tối thiểu, a và b được tính để cực tiểu hóa tổng bình phương của các độ lệch thẳng đứng (vẽ bằng các đường chấm) của các điểm đối với đường thẳng, mỗi độ lệch bằng hiệu số giữa số y quan sát và tiểm tương ứng trên đường thẳng a + bx

Trong thí dụ này

b = 8,96/205,38 = 0,043615

Và:

a = 3,0025 - 0,043615 × 66,875 = 0,0857 Do đó sự phụ thuộc của thể tích huyết tương vào trọng lượng cơ thể được mô tả bằng

Thể tích huyết tương = 0,0857 + 0,0436 × trọng lượng và được vẽ trên Hình 9.1. Ðường hồi quy được vẽ bằng cách tính tọa độ của hai điểm nằm trên nó. Thí dụ:

x = 60, y = 0,0857 + 0,0436 × 60 = 2,7

x = 70, y =0,0857 + 0,0436 × 70 = 3,1 Ðường thẳng phải đi qua điểm ( x, y)=(66,9 , 3,0)

Page 53: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

TƯƠNG QUAN VÀ HỒI QUY TUYẾN TÍNH

49

2)().(.

xxsbes−∑

=

Giá trị a và b là các ước lượng mẫu của giá trị giao điểm và độ dốc của đường thẳng hồi quy mô tả mối liên hệ tuyến tính giữa x và y trong toàn bộ dân số. Do đó chúng bị các biến thiên lấy mẫu và độ chính xác của chúng có thể đo lường bằng sai số chuẩn.

trong đó

−∑−−∑=)2(

)()( 222

nxxbyys

s là độ lệch chuẩn của các điểm số liệu so với đường thẳng, có (n-2) độ tự do.

2189.06

38.2050436.06780.0 2

=×−=s

3197138205966

8128190

2

....s.e.(a) =

+=

0153.038.205

2189.0).(. ==bes

Kiểm định ý nghĩa

Kiểm định t được dùng để kiểm định xem b có khác biệt có ý nghĩa với một giá trị nhất định, được kí hiệu là ß (kí tự Hy lạp beta)

2..,).(.

−=−= nfdbes

bt β

Ðặc biệt nó có thể dùng để kiểm định xem b có khác biệt có ý nghĩa với zero hay không. Và nó chính xác tương đương với kiểm định t của r = 0. Kiểm định này cho thể tích huyết tương và trọng lượng cơ thể cho kết quả

85.20153.00436.0

).(.==−=

besbt β

Và giống như giá trị 2,86 (sự khác nhau là do sai số làm tròn) rút ra từ kiểm định cho hệ số tương quan. Do đó thể tích huyết tương tăng có ý nghĩa (P<0,05) đối với trọng lượng cơ thể.

Tiên đoán

Trong một số tình huống, có thể sử dụng phương trình hồi quy để tiên đoán giá trị y cho một giá trị đặc biệt của x được gọi là x'. Giá trị tiên đoán là:

y' = a + bx'

Và sai số chuẩn của nó là

−∑

+=2

2

)(1

).(.xx

xn

saes

Page 54: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

50

−∑−++= 2

2

)()'(11)'.(.xx

xxn

syes

Sai số chuẩn này tối thiểu khi x' gần với trung bình x. Nói chung phải thận trọng khi sử dụng đường hồi quy để tính các giá trị ngoài phạm vi của x trong số liệu gốc, bởi vì quan hệ tuyến tính không nhất thiết sẽ đúng ở ngoài phạm vi mà nó được làm phù hợp.

Trong thí dụ này, sự đo lường thể tích huyết tương tốn nhiều thời gian và do đó trong một số trường hợp, có thể tiên đoán từ trọng lượng cơ thể. Thí dụ thể tích plasma huyết tương của một người đàn ông nặng 66 kg là

0,0832 + 0,0436 × 66 = 2,96 lít

Và sai số chuẩn bằng

lsyes 23.038.205

)9.6666(811)'.(.

2

=

−++=

Giả thiết

Có hai giả thiết nền tảng trong phương pháp hồi quy tuyến tính. Giả thiết thứ nhất là đối với bất cứ giá trị x nào, y có phân phối bình thường. Giả thiết thứ hai là độ phân tán của các điểm quanh đường thẳng là như nhau trong suốt đoạn thẳng. Ðộ phân tán được đo lường bằng độ lệch chuẩn s của các điểm số liệu so với đường thẳng như đã định nghĩa ở trên. Sự thay đổi thang đo có thể thích hợp nếu các giả thuyết trên không thỏa hay quan hệ dường như phi tuyến tính (xem Chương 19). Các quan hệ phi tuyến được thảo luận ở chương 10.

Sử dụng máy tính cầm tay Một vài máy tính cầm tay có hàm số hồi quy tuyến tính và tương quan tự động (xem Chương 1), giúp cho tránh những tính toán tỉ mỉ mô tả ở trên.

Page 55: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

HỒI QUY BỘI

51

HỒI QUY BỘI

Giới thiệu Ðôi khi xảy ra tình huống là chúng ta quan tâm sự phụ thuộc của một biến vào nhiều các biến giải thích chứ không phải chỉ vào một biến. Thí dụ, 100 phụ nữ đi khám tiền sản tham gia vào một cuộc nghiên cứu để xác định các biến số có liên quan với trọng lượng lúc sinh của trẻ, với mục tiêu cuối cùng là tiên đoán phụ nữ 'có nguy cơ' bị đẻ con nhẹ cân. Kết quả cho thấy rằng trọng lượng lúc sinh liên quan có ý nghĩa với tuổi của mẹ, chiều cao của mẹ, số con, thời gian mang thai, thu nhập gia đình nhưng những biến số này không độc lập. Thí dụ: chiều cao của mẹ và thời gian mang thai có liên quan với nhau. Sự tác động kết hợp của những biến số này, tính đến những mối liên hệ dương giữa chúng, có thể được tìm hiểu bằng cách dùng hồi quy bội (mutitple regression) được thảo luận trong bối cảnh của thí dụ này.

Ðể giới thiệu những phương pháp cần thiết cho hồi quy bội, một phương án hồi quy tuyến tính đơn khác, tương đương với phương án được mô tả ở Chương 9, nhưng dễ tổng quát hóa hơn sẽ được mô tả. Sau đó nó sẽ được mở rộng cho nhiều biến giải thích. Chi tiết tính toán không được trình bày bởi vì việc phân tích chắc chắn sẽ được tiến hành bằng cách dùng phần mềm máy tính. Phương pháp luận khá phức tạp và một số độc giả có thể bỏ qua chương này ở lần đọc đầu tiên.

Phương pháp phân tích phương sai dùng cho hồi quy tuyến tính đơn Xem xét mối quan hệ giữa trọng lượng lúc sinh với chiều cao của mẹ. Phân tán đồ cho thấy rằng mối liên hệ là tuyến tính. Hệ số tương quan là 0,26 (P<0,01).

Hồi quy tuyến tính cho phương trình đường thẳng mô tả quan hệ:

Trọng lượng lúc sinh = a + b × chiều cao của mẹ

Trong đó a và b được tính sao cho cực tiểu hóa tổng các bình phương độ lệch của số liệu so với đường thẳng. Tổng các bình phương độ lệch đối với đường thẳng sau khi đã tiến hành cực tiểu hóa được gọi là tổng bình phương phần dư (residual sum of squares). Nó nhỏ hơn tổng bình phương tổng các biến thiên của trọng lượng lúc sinh và hiệu số đó được gọi là tổng các bình phương được giải thích bởi hồi quy (sum of squares explained by the regression) của trọng lượng lúc sinh theo chiều cao của mẹ, hay gọi đơn giản là tổng bình phương hồi quy (regression sum of squares). Tách đôi tổng bình phương của toàn thể biến thiên trọng lượng lúc sinh thành 2 phần có thể được trình bày trong bảng phân tích phương sai (Bảng 10.1). Có một độ tự do cho hồi quy và n - 2 = 98 độ tự do cho phần dư.

Nếu thực sự không có sự liên hệ giữa các biến số, thì trung bình bình phương hồi quy (MS regression) sẽ có cùng độ lớn với trung bình bình phương phần dư (MS residual). Nếu có sự liên hệ nó sẽ lớn hơn. Kiểm định bằng cách dùng kiểm định F như được mô tả trong Chương 8.

Bảng 10.1 Phân tích phương sai của hồi quy tuyến tính trọng lượng lúc sinh theo chiều cao của mẹ (n=100)

Nguồn biến thiên

Tổng bình phương (SS)

Ðộ tự do (d.f.)

Trung bình bình phương

(MS=SS/d.f.)

MS hồi qui F=------------- MS phần dư

Hồi quy theo chiều cao của mẹ

1,48 1 1,4800 7,11,P<0,01

Phần dư 20,39 98 0,2081 Tổng số 21,87 99

Page 56: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

52

)2,1(.., −== nfdMSMSF

dæ pháön quy häöi

F phải khoảng gần 1 nếu không có sự liên hệ và lớn hơn nếu có. Kiểm định F này tương đương với kiểm định t cho b=0 và r=0 mô tả ở chương 9, giá trị của F tương đương với t2. Trong thí dụ này F = 1,4800/0,2081= 7,11 với (1,98) độ tự do. Từ bảng A4, điểm 1% của F(1,60) là 7,08 và F(1,120) là 6,85. Ðiểm 1% cho F(1,98) do đó nằm giữa 7,08 và 6,85 và F=7,11 có ý nghĩa ở mức 1%.

Quan hệ giữa hệ số tương quan và bảng phân tích phương sai Bảng phân tích phương sai cho phép lí giải hệ số tương quan theo cách khác: bình phương của hệ số tương quan, r2, bằng với tổng bình phương hồi quy chia cho tổng bình phương toàn bộ (0,262=0,0676=1,48/21,87) và do đó là tỉ lệ biến thiên được giải thích bằng hồi quy. Chúng ta có thể nói chiều cao người mẹ giải thích cho 6,76% tổng số biến thiến của trọng lượng lúc sinh.

Hồi quy bội với 2 biến số Xét quan hệ của trọng lượng lúc sinh với hai biến: chiều cao của mẹ và tuổi thai. Phân tán đồ cho thấy rằng quan hệ giữa trọng lượng lúc sinh với hai biến kia là tuyến tính. Hệ số tương quan tương ứng là 0,26 (P<0,01) và 0,39 (P<0,001). Mối quan hệ kết hợp có thể được thể hiện bằng phương trình hồi quy bội (multiple regression equation),

y = a + b1x1 + b2x2

Và trong thí dụ này

Trọng lượng lúc sinh = a + b1 chiều cao của mẹ + b2tuổi thai Nó có nghĩa là với bất cứ tuổi thai nào, trọng lượng lúc sinh quan hệ tuyến tính với chiều cao của mẹ và cũng vậy, với bất cứ chiều cao của mẹ nào, trọng lượng lúc sinh liên hệ tuyến tính với tuổi thai. b1và b2 được gọi là hệ số hồi quy riêng phần (partial regression coefficients) và sự tương quan tương ứng là tương quan riêng phần (partial correlations). Lưu ý rằng b1 và b2 khác nhau hệ số hồi quy thông thường (đối với một biến số) trừ khi hai biến số này không liên quan với nhau.

Mặc dù bây giờ khó có thể hình dung được đường hồi quy, ta cũng sử dụng những nguyên lí tương tự. Mỗi trọng lượng lúc sinh quan sát được được so sánh với (a + b1 chiều cao của mẹ + b2tuổi thai). a, b1 , b2 được chọn để cực tiểu hóa tổng bình phương các hiệu số này. Kết quả được trình bay trong bảng phân tích phương sai (Bảng 10.2). Có hai độ tự do của hồi quy bởi vì có hai biến số giải thích.

Kiểm định F của hồi quy này là 12,32 với (2,97) độ tự do và có ý nghĩa ở mức 0,1%. Hồi quy đóng góp cho 20,26% (4,43/21,87) tổng số biến thiên. Tỉ lệ này bằng R2, R = √ 0,2026=0,45

Bảng 10.2 Phân tích phương sai của hồi quy tuyến tính trọng lượng lúc sinh theo chiều cao của mẹ và tuổi thai (n=100)

Nguồn biến thiên

Tổng bình phương (SS)

Ðộ tự do (d.f.) Trung bình bình phương (MS=SS/d.f.)

MS hồi qui F=------------- MS phần dư

Hồi quy theo chiều cao của mẹ và tuổi thai

4,43 2 2,2150 12,32,P<0,001

Phần dư 17,44 97 0,1798 Tổng số 21,87 99

Page 57: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

HỒI QUY BỘI

53

được gọi là hệ số tương quan bội (multiple correlation coefficient). R luôn luôn dương tính bởi vì không thể xác định hướng của liên quan khi có nhiều biến số.

Tổng bình phương do hồi quy của trọng lượng lúc sinh do chiều cao của mẹ và tuổi thai gồm tổng bình phương được giải thích bởi chiều cao của mẹ (tính như trong hồi quy tuyến tính đơn) cộng với tổng bình phương được giải thích bởi tuổi thai sau khi đã được giải thích bằng chiều cao của mẹ (Bảng 10.3a). Tổng này có thể được kiểm định ý nghĩa bằng kiểm định F dùng trung bình bình phương phần dư

F = 2,95/0,1798=16,41 d.f.=(1,97), P<0,001 Do đó mô hình của hai biến số là sự cải thiện so với mô hình chỉ dựa trên chiều cao của mẹ bởi vì tác động của tuổi thai có ý nghĩa ngay cả khi đã tính đến chiều cao của mẹ.

Theo cách khác, tổng bình phương được giải thích bởi hồi quy với cả hai biến bao gồm tổng bình phương được giải thích bởi tuổi thai (tính bằng hồi quy tuyến tính đơn) cộng với tổng bình phương được giải thích do chiều cao của mẹ sau khi đã điều chỉnh theo tuổi thai. Ðiều này trình bày trong Bảng 10.3(b). Một lần nữa chúng ta thấy rằng mô hình hai biến số có cải thiện so với mô hình chỉ có tuổi thai, bởi vì tác động của chiều cao của mẹ có ý nghĩa ngay cả khi tuổi thai đã được tính.

Hai cách tách tổng bình phương hồi quy kết hợp trong bàng 10.2 thành tổng bình phương riêng biệt không cho các bình phương kết quả thành phần giống nhau (Bảng 10.3a và b) bởi vì bản thân các biến giải thích (chiều cao của mẹ và tuổi thai) liên quan với nhau.

Hồi quy bội với nhiều biến Hồi quy bội có thể mở rộng ra với một số các biến số, mặc dù cần nhắc rằng số các biến số nên tương đối nhỏ và với nhiều biến số việc lí giải trở nên phức tạp. Một số biến số, như tuổi và giới tính, có thể cần thiết đưa vào phương trình hồi quy bội bởi vì cần thiết điều chỉnh tác động của chúng trước khi nghiên cứu các quan hệ khác. Ðưa vào những biến khác dựa trên chúng liên hệ nhiều hay ít với biến phụ thuộc. Mục tiêu là đạt được sự cân bằng giữa một mặt là bao gồm đủ các biến số để thu được sự phù hợp tốt nhất giữa phương trình hồi quy bội và

Bảng 10.3 Sự đóng góp của chiều cao của mẹ và tuổi thai vào hồi quy bội bao gồm cả hai biến

(a) chiều cao của mẹ đưa vào hồi quy bội trước Nguồn biến thiên Tổng bình

phương (SS) Ðộ tự do

(d.f.) Trung bình bình

phương (MS=SS/d.f.)

MS hồi qui F=-------------- MS phần dư

Chiều cao của mẹ 1,48 1 1,48 8,23,P<0,01 Tuổi thai sau khi đã điều chỉnh theo chiều cao

2,95 1 2,95 16,41, P<0,001

Chiều cao của mẹ và tuổi thai

4,43 2

(b) tuổi thaiđưa vào hồi quy bộ trước

Nguồn biến thiên Tổng bình phương (SS)

Ðộ tự do (d.f.)

Trung bình bình phương

(MS=SS/d.f.)

MS hồi qui F=-------------- MS phần dư

Tuổi thai 3,33 1 3,33 18,52,P<0,001 Chiều cao sau khi đã điều chỉnh theo tuổi thai

1,10 1 1,10 6,12, P<0,025

Chiều cao của mẹ và tuổi thai

4,43 2

Page 58: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

54

số liệu, mặt khác là không có quá nhiều biến số để quan hệ trở thành khó lí giải. Việc chọn lựa biến số có thể tiến hành theo một trong 3 cách:

1. Hồi quy bước tới (Step-up regression). Hồi quy tuyến tính đơn được tiến hành cho mỗi biến giải thích. Biến nào đóng góp phần trăm biến thiên lớn nhất được chọn và làm biến số đầu tiên. Sau đó tiến hành hồi quy bội hai biến bằng cách thêm vào từng biến số giải thích khác. Sau đó chọn hồi quy hai biến đóng góp phần trăm biến thiên lớn nhất. Quá trình này tiếp tục bằng cách chọn thêm một biến ở mỗi giai đoạn. Quá trình này ngừng khi (i) thêm vào bất kì biến số nào cũng không làm tăng có ý nghĩa phần đóng góp của nó hay (ii) Khi đã đạt được số các biến số tối đa đã định trước trong hồi quy bội.

2. Hồi quy bước lùi (Step down regression) Hồi quy bội được tiến hành bằng cách dùng tất cả các biến số. Sau đó các biến được loại bỏ từng biến một. Ở mỗi giai đoạn, biến được chọn để loại bỏ là biến đóng góp ít nhất vào việc giải thích các biến thiên. Quá trình này tiếp tục cho đến khi (i) tất cả các biến còn lại đều có ý nghĩa hay (ii) cho đến khi đã đạt được số các biến số tối đa đã định trước trong phương trình.

3. Hồi quy tổ hợp tối ưu (Optimal combination regression). Hồi quy từng bước theo cách 1 và 2 không nhất thiết đưa đến cùng một chọn lựa cuối cùng, ngay cả khi chúng cùng kết thúc ở một số các biến số giải thích nhất định. Không nhất thiết rằng chúng chọn được hồi quy tốt nhất cho một số các biến số giải thích. Cách tốt hơn là tìm một biến nào là tốt nhất, rồi từng cặp biến nào là tốt nhất, sau đó là từng cặp 3 biến nào là tốt nhất, bằng cách tiến hành hồi quy tất cả các tổ hợp có thể. Lưu ý rằng mặc dù cặp hồi quy tốt nhất thường chứa biến hồi quy đơn tốt nhất, nhưng điều đó không nhất thiết phải xảy ra.

Hồi quy bội với các biến giải thích rời rạc Người ta thường muốn đưa vào các biến liên tục và rời rạc trong phân tích hồi quy bội. Thí dụ, trong nghiên cứu trọng lượng lúc sinh, sáu phụ nữ bị nhiễm mycoplasma trong lúc mang thai và trọng lượng trung bình của con họ sẽ nhỏ hơn. Yếu tố này có thể được đưa vào nhờ một biến số giả (dummy variable) của sự nhiễm trùng. Nó bằng 1 cho người phụ nữ bị nhiễm mycoplasma và bằng zero cho phụ nữ không bị. Phương trình hồi quy

Trọng lượng lúc sinh = a + b1 chiều cao của mẹ + b2 tuổi thai + b3 nhiễm trùng

Ðiều này tương đương với một cặp phương trình

(a) Trọng lượng lúc sinh = a + b1 chiều cao của mẹ + b2 tuổi thai + b3 cho người phụ nữ bị nhiễm mycoplasma

(b) Trọng lượng lúc sinh = a + b1 chiều cao của mẹ + b2 tuổi thai cho người phụ nữ không bị nhiễm mycoplasma

Hệ số b3 đo lường sự khác nhau trung bình của trọng lượng lúc sinh của con người mẹ bị nhiễm mycoplasma so với con người mẹ có cùng trọng lượng và tuổi thai và không bị nhiễm. Tổng bình phương gia số do nhiễm trùng mycoplasma được tìm bằng phương pháp đã được mô tả ở trên. Nó là hiệu số giữa tổng bình phương do hồi quy bội 3 biến trừ đi hồi quy chỉ dựa trên chiều cao của mẹ và tuổi thai. Nó có một độ tự do và được kiểm định ý nghĩa bằng kiểm định F.

Nhiễm trùng mycoplasma là một yếu tố có hai mức, có hay không. Yếu tố có hơn 2 mức, thí dụ như nhóm tuổi, được đưa vào bằng một loạt các biến giả để mô tả sự khác nhau. Nếu có k mức, sẽ cần k-1 biến giả và độ tự do bằng k-1. Xem chi tiết ở Armitage và Berry (1987).

Hồi quy bội với các biến giải thích phi tuyến tính Người ta thường thấy quan hệ phi tuyến giữa biến phụ thuộc và biến giải thích. Có 3 cách sử dụng biến giải thích đó trong phương trình hồi quy bội. Phương pháp thứ nhất, phổ biến nhất là chia biến thành một số các nhóm nhỏ và xem nó như là một yếu tố với một mức tương ứng với một nhóm nhỏ, như được mô tả ở phần trên chứ không phải là biến liên tục. Thí dụ, tuổi

Page 59: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

HỒI QUY BỘI

55

có thể chia thành nhóm 5 tuổi một. Quan hệ với tuổi được dựa trên sự so sánh trung bình trong mỗi nhóm tuổi và không cần giả thiết về dạng quan hệ với tuổi. Ở bước phân tích đầu tiên, người ta thường đưa biến giải thích vào dưới hai dạng liên tục và yếu tố. Hiệu số của tổng bìnhphương được dùng để đánh giá xem có thành phần phi tuyến trong mối quan hệ hay không. Trong phần lớn trường hợp, chia thành 3 tới 5 nhóm nhỏ là đủ để nghiên cứu tính phi tuyến của quan hệ.

Khả năng thứ nhì là tìm sự biến đổi thích hợp cho biến giải thích. Thí dụ, trong nghiên cứu trọng lượng lúc sinh, người ta thấy rằng trọng lượng lúc sinh có liên hệ tuyến tính với logarithm của thu nhập gia đình chứ không liên hệ tuyến tính với thu nhập gia đình. Dùng các phép biến đổi được thảo luận đầy đủ hơn ở Chương 19. Khả năng thứ ba là tìm cách mô tả đại số mối quan hệ. Thí dụ, nó có thể là dạng bình phương, trong trường hợp đó cả biến số (x) và bình phương của biến số (x2) sẽ được đưa vào phương trình.

Quan hệ giữa hồi quy bội và phân tích phương sai Có nhiều sự trùng lắp giữa hồi quy bội và phân tích phương sai. Hồi quy bội trong đó các biến giải thích là rời rạc cũng giống như phân tích phương sai với nhiều yếu tố. Hai phương pháp cho cùng một kết quả giống nhau. Trong trường hợp này người ta khuyên nên dựa vào các chương trình máy tính có sẵn và tính dễ sử dụng của chúng để lựa chọn.

Một kĩ thuật khác không được mô tả ở đây là phân tích đồng phương sai (analysis of covariance) (Armitage & Berry 1987). Nó là một phương pháp khác nhưng tương đương để nghiên cứu sự khác biệt trong các nhóm khi có các biến giải thích liên tục. Một thí dụ của bài toán mô tả ở trên khi so sánh trọng lượng lúc sinh giữa các bà mẹ bị nhiễm mycoplasma trong thai kì và những bà mẹ không bị. Chiều cao của mẹ và tuổi thai là các biến giải thích bổ sung và sẽ được gọi là đồng biến số (covariate) trong trường hợp này. Lưu ý rằng đối khi phân tích đồng phương sai được gộp trong phân tích phương sai trong một số phần mềm máy tính.

Phân tích đa biến Hồi quy bội, phân tích phương sai, hồi quy logistic (xem chương 13) và mô hình log tuyến tính (xem Chương 13) thường được gọi là những phương pháp đa biến (mulivariate methods), bởi vì chúng nghiên cứu biến phụ thuộc liên quan tới nhiều biến giải thích như thế nào. Theo nghĩa thống kê chặt chẽ, phân tích đa biến (multivariate analysis) có nghĩa là nghiên cứu những biến phụ thuộc thay đổi cùng với nhau như thế nào. Có bốn phương pháp thích hợp cho nghiên cứu y khoa được mô tả ngắn gọn ở đây. Xem chi tiết ở Armitage & Berry (1987).

Phân tích thành phần chính (pricipal component analysis) là phương pháp dùng để tìm một số các kết hợp các biến số, được gọi là thành phần để giải thích toàn bộ các biến thiên quan sát được và giảm tính phức tạp của số liệu. Phân tích phân biệt (discriminat analysis) là phương pháp dùng để tìm một kết hợp duy nhất các biến số, được gọi là hàm phân biệt (discriminant function) phân biệt tốt nhất các nhóm. Hàm số này được dùng để tiên đoán một cá nhân sẽ có thể thuộc vào nhóm nào. Thí dụ, nó đã được dùng để tiên đoán trẻ em có nguy cơ đột tử. Phân tích yếu tố (factor analysis) là phương pháp thương được dùng trong các trắc nghiệm tâm lí học. Nó tìm cách giải thích các trả lời cho các mục trắc nghiệm bị tác động bởi một số các yếu tố, như tình cảm, suy lý v.v. như thế nào. Cuối cùng, phân tích cụm (cluster analysis) la phương pháp xem xét các biến số sể xem một cá nhân có thể chia thành một hệ thống tự nhiên các nhóm. Các kĩ thuật được dùng bao gồm các kĩ thuật phân loại học số (numerical taxonomy), thành phần chính, và phân tích tương ứng (correspondance analysis).

Page 60: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

56

XÁC SUẤT

Giới thiệu Xác suất đã được dùng nhiều lần trong các chương trước, và nghĩa của nó rõ ràng trong bối cảnh của nó. Bây giờ ta sẽ trình bày nó chính thức hơn và đưa ra các quy tắc tính toán. Mặc dù xác suất là một khái niệm được dùng trong cuộc sống hàng ngày, chúng ta khó lòng định nghĩa nó chính xác được. Ðịnh nghĩa theo tần suất (frequentist definition) thường được dùng trong thống kê. Nó nói rằng xác suất xuất hiện của một biến cố bằng tỉ lệ số lần các biến cố đó xuất hiện trong một số lớn các lần thử giống nhau được lập lại. Nó có giá trị giữa 0 và 1, bằng 0 nếu sự kiện không thể xảy ra và bằng 1 nếu nó chắc chắn xảy ra. Xác suất có thể tính bằng phần trăm và có giá trị từ 0% đến 100%. Thí dụ, giả sử một đồng tiền được tung một ngàn lần và trong phân nửa các trường hợp nó nằm ngửa mặt và trong phân nửa trường hợp nó nằm xấp. Xác suất nó ngửa ở một lần tung sẽ là 50%.

Một cách khác là định nghĩa chủ quan (subjective definition) khi độ lớn của xác suất chỉ thể hiện mức độ tin tưởng của một người vào sự xuất hiện của biến cố. Ðịnh nghĩa này gần với cách dùng thường ngày và là cơ sở của phương pháp Bayes (Bayesian approach). Theo phương pháp này người nghiên cứu gắn một xác suất tiền nghiệm (prior probability) cho biến cố được nghiên cứu. Sau đó người ta tiến hành nghiên cứu, thu thập số liệu số liệu, và thay đổi xác suất tùy theo kết quả có được. Xác suất được biến cải này được gọi là xác suất hậu nghiệm (posterior probability). Phương pháp thống kê bắt nguồn từ phương pháp này hoàn toàn khác lạ và ít được sử dụng rộng rãi. Xem chi tiết ở Lindley (1965).

Tính toán xác suất Có hai quy tắc căn bản của tính toán xác suất:

1. Quy tắc nhân (mulplicative rule) tính xác suất xuất hiện của cả hai biến cố A và B

2. Quy tắc cộng (additive rule) tính xác suất xuất hiện của biến cố (A) hay biến cố (B) hay cả hai

Quy tắc nhân Xem một cặp vợ chồng dự định sẽ co 2 con. Có 4 tổ hợp giới tính của trẻ được trình bày trong bảng 11.1. Mỗi tổ hợp như nhau về mặt khả năng và có xác suất bằng 1/4.

Bảng 11.1 Các tổ hợp có thể của giới tính hai đứa trẻ với xác suất của chúng

Trẻ thứ nhì

Ðứa thứ nhất Trai 1/2

Gái 1/2

Trai 1/2 1/4 (trai, trai)

1/4 (trai, gái)

Gái 1/2 1/4 (gái, trai)

1/4 (gái, gái)

Mỗi xác suất 1/4 được suy ra từ xác suất về giới tính của mỗi đứa trẻ. Xem chi tiết trường hợp 2 đứa trẻ là gái. Xác suất đứa trẻ đầu là gái là 1/2 và sau đó xác suất 1/2 của nó (1/2 của 1/2 là 1/4) rằng đứa trẻ thứ hai cũng là con gái. Do đó:

Xác suất (hai đứa trẻ là gái) = xác suất (đứa trẻ đầu là gái) × xác suất (đứa trẻ thứ nhì là gái) = 1/2 × 1/2 = 1/4

Page 61: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

XÁC SUẤT

57

Quy tắc chung của xác suất xuất hiện hai biến cố là

Xác suất (A và B) = xác suất (A) × xác suất (B khi A đã xẩy ra). Xác suất (B khi A đã xảy ra) được gọi là xác suất điều kiện (conditional probability) bởi vì nó là xác suất xảy ra biến cố B khi đã xảy ra biến cố A. Nếu khả năng của biến cố B không bị tác động bởi sự xuất hiện hay không xuất hiện của biến cố A và ngược lại, biến cố A và biến cố B được gọi là độc lập (independent) và qui tắc trở thành:

Xác suất (A và B) = xác suất (A) × xác suất (B), nếu A và B độc lập Giới tính của đứa trẻ là biến cố độc lập bởi vì đứa trẻ sau là gái không bị tác động bởi giới tính của đứa bé trước. Một thí dụ của biến cố phụ thuộc (dependent) là xác suất một đứa trẻ ở Ấn độ bị thiếu máu và suy dinh dưỡng, bởi vì đứa trẻ sẽ dễ bị thiếu máu nếu nó bị suy dinh dưỡng.

Quy tắc cộng

Xác suất (A hay B hay cả hai) = xác suất (A) + xác suất (B) - xác suất (cả hai) Quy tắc này được minh họa trong một thí dụ. Xem một vùng ở Nam Mỹ ở đó xác xuất bị nhiễm giun móc là 0,5 và xác suất bị sán máng là 0,6. Rõ ràng xác suất có hoặc là giun móc, hoặc là sán máng, hoặc là cả hai không phải là tổng số 0,5 + 0,6 = 1,1, bởi vì xác suất không thể lớn hơn 1. Vấn đề là xác suất bị nhiễm giun móc và sán máng được tính hai lần, một lần trong xác suất nhiễm giun móc, một lần trong xác suất nhiễm sán máng. Tính toán đúng như sau:

Xác suất (giun móc hay sáng máng hay cả hai) = xác suất (giun móc)+xác suất (sán

máng) - xác suất (nhiễm hai loại) Nếu hai bệnh độc lập với nhau

Xác suất (nhiễm hai loại) = 0,5 × 0,6 = 0,3 Xác suất (giun móc hay sáng máng hay cả hai) = 0,5 + 0,6 - 0,3 = 0,8

Page 62: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

58

TỈ LỆ

Giới thiệu Phương pháp được mô tả từ Chương 4 tới Chương 10 dành cho biến số liên tục. Chúng ta hãy xem xét phương pháp thích hợp cho tỉ lệ, đó là biến số rời rạc. Chúng ta bắt đầu bằng việc mô tả phân phối lấy mẫu của một tỉ lệ đựa trên phân phối nhị thức, và chúng ta sẽ mô tả phân phối nhị thức có thể được xấp xỉ bằng phân phối bình thường như thế nào.

Phân phối nhị thức Tỉ lệ được dựa trên một biến số nhị phân (binary variable), trong đó giá trị cho mỗi cá thể trong một mẫu sẽ là một trong hai giá trị mà ta gọi là A hay B. Thí dụ, bệnh nhân sống sót (A) hay chết (B), một bệnh phẩm là dương tính (A) hay âm tính (B), hay một đứa trẻ được chích ngừa (A) hay không chích ngừa (B). Tỉ lệû (proportion) của A là số (r) các biến cố A chia cho tổng số trong mẫu

P = r/n Số (và tỉ lệ) của biến cố A được quan sát trong mẫu dĩ nhiên sẽ bị biến thiên lấy mẫu (xem Chương 3), các mẫu khác nhau có thể có những giá trị khác nhau. Phân phối lấy mẫu được gọi là phân phối nhị thức (binomial distribution) và có thể được tính từ cỡ mẫu, n, và tỉ lệ dân số, p , như trong thí dụ 12.1. p (kí tự Hi lạp pi; không liên quan gì đến hằng số toán học 3,1416) là xác suất đáp ứng của một cá nhân là A.

Thí dụ 12.1

Một người đàn ông và đàn bà có tính trạng lặn của bệnh hồng cầu liềm (AS; nghĩa là dị hợp tử của gen hemoglobin hồng cầu liềm [S] và bình thường [A]) có 4 đứa con. Tính xác suất có không đứa trẻ nào, một, hai, hai, ba hay bốn đứa trẻ bị bệnh hồng cầu liềm (SS)?

Ðối với mỗi đứa trẻ xác suất bị bệnh hồng cầu liềm (SS) là xác suất bị di truyền gen S từ cha và mẹ, đó là 0,5 × 0,5 = 0,25 theo quy tắc nhân xác suất (Chương 11). Xác suất không bị SS (đó là AS hay AA) do đó là 0,75. Chúng ta gọi SS là A và không phải SS là B do đó p = 0,25

Xác suất của không đứa trẻ nào bị bênh là SS (r=0) là 0,75 × 0,75 × 0,75 × 0,75 = 0,754 = 0,3164, trong đó 0,754 là 0,75 lũy thừa 4 nghĩa là 0,75 nhân với nhau 4 lần. Ðiều này là do quy tắc nhân xác suất.

Xác suất cho một đứa trẻ bị SS là xác suất (đứa trẻ thứ nhất bị SS và đứa trẻ thứ hai, thứ ba, thứ tư không bị SS) hay (đứa trẻ thứ hai bị SS và đứa trẻ thứ nhất, thứ ba, thứ tư không bị SS) hay (đứa trẻ thứ ba bị SS và đứa trẻ thứ nhất, thứ hai, thứ tư không bị SS) hay (đứa trẻ thứ tư bị SS và đứa trẻ thứ nhất, thứ hai, thứ ba không bị SS). Mỗi khả năng này có xác suất là 0,25 × 0,753 (quy tắc nhân xác suất) và bởi vì chúng không thể xảy ra đồng thời với nhau xác suất xảy ra một trong 4 khả năng trên là 4 × 0,25 × 0,753 = 0,4219, theo quy tắc cộng xác suất.

Theo cách tương tự ta có thể tính xác suất có hai, ba, hay bốn đứa trẻ bị bệnh hồng cầu liềm bằng cách tính trong từng trường hợp, những chỉnh hợp có thể trong gia đình và cộng xác suất của chúng. Có được xác suất chỉ ra trong bảng 12.1. Lưu ý rằng tổng xác suất là 1, đó là phải có 1 trong 4 khả năng phải xảy ra. Xác suất cũng được dùng minh họa phân phối xác suất trong hình 12.1. Ðây là phân phối nhị thức cho p = 0,25 và n = 4.

Page 63: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

TỈ LỆ

59

Công thức tổng quát cho phân phối nhị thức

Công thức tổng quát cho xác xuất có r biến cố A trong mẫu gồm n đối tượng khi xác suất xảy ra biến cố A cho mỗi đối tượng là p:

rnr rn!r!(n-r

n! −−= )1()

A)cäú biãúnláönP(r

Trong phần thứ nhất của công thức là số các cách trong đó r biến cố A có thể có trong một mẫu n, phần thứ hai bằng xác suất của một trong các cách đó. Dấu chấm tham kí hiệu giai thừa (factorial) của một số và có nghĩa là nhân tất cả với nhau các số nguyên từ số đó đến số 1. (0! được định nghĩa là bằng 1), pr có nghĩa là p lũy thừa r hay p nhân với nhau r lần. Một số bất kì lũy thừa zero bằng 1. Thí dụ áp dụng công thức trên trong thí dụ trên để tính xác suất có hai trong bốn đứa trẻ bị bệnh hồng cầu liềm là:

2109.0)25.01(25.0)242

4 242 =−= −

!-!(!liãöm) cáöuhäöng bëtreí P(2

Nhiều máy tính cầm tay có phím để tính giai thừa và lũy thừa. Nếu không có thể tính dễ dàng bằng cách dùng biểu thức sau, trong đó (r- n)! được triệt tiêu trong n!

Bảng 12.1 Tính toán xác suất số trẻ em bị di truyền bịnh hồng cầu liềm (SS) trong một gia đình có 4 đứa trẻ trong đó cha mẹ có tính trạng hồng cầu liềm lặn ( xác suất một cá nhân bị di truyền bệnh hồng cầu liềm là 0,25)

Bị hồng cầu liềm Không bị hồng cầu liềm

số cách các tổ hợp có thể xảy

ra

xác suất

0 4 1 1 × 1 × 0,754 = 0,3164 1 3 4 4 × 0,25 × 0,753 = 0,3164 2 2 6 6 × 0,252 × 0,752 =0,2109 3 1 4 4 × 0,253 × 0,75 =0,0469 4 0 1 1 × 0,254 × 1 =0,0039

Tổng số = 1,000

Hình 12.1 phân phối xác suát của số trẻ trong gia đình 4 người bị bệnh hồng cầu liềm khi cả bố mẹ mang tính trạng lặn hồng cầu liềm. Xác suất đứa trẻ bị hồng cầu liềm là 0,25.

Page 64: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

60

123...)1()1(...)2()1(

)!(!!

××××−×−−××−×−×=

− rrrnnnn

rnrn

Thí dụ nếu n=18 r=5, (n-r+1)=18-5+1=14 và biểu thức trở thành

8568120

1028160123451415161718 ==

××××××××

Ðộc giả quan tâm có thể thực tập công thức trên bằng cách tính lại các công thức trình bày ở bảng 12.1 và 12.3. Lưu ý rằng khi p = 0,5 thì (1-p) cũng bằng 0,5 và phần thứ hai của công thức bằng 0,5n

Tính chất của phân phối nhị thức

Hình 12.2 trình bày thí dụ của phân phối nhị thức cho những giá trị khác nhau của p và n. Những phân phối này đã được trình bày theo số lần xuất hiện, r, biến cố A trong mẫu, mặc dù chúng có thể áp dụng p, tỉ lệ của biến cố A. Thí dụ, khi cỡ mẫu bằng 5 các giá trị có thể của r là 0, 1, 2, 3, 4, 5 và trục hoành được kí hiệu theo đó. Các tỉ lệ tương ứng là 0, 0,2, 0,4, 0,6, 0,8, 1. Kí hiệu lại trục hoành theo giá trị các tỉ lệ sẽ có phân phối bình thường của p. Lưu ý rằng, mặc dù p là phân số, phân phối của nó là rời rạc và không liên tục, bởi vì nó chỉ gồm một số các giá trị giới hạn cho một cỡ mẫu nhất định.

Bởi vì phân phối nhị thức là phân phối lấy mẫu cho số (hay tỷ lệ) các biến cố A, trung bình của nó bằng trung bình dân số và độ lệch chuẩn của nó thể hiện sai số chuẩn, đo lường giá trị mẫu ước lượng giá trị dân số chính xác tới đâu. Trung bình dân số và sai số chuẩn được cho ở Bảng 12.2 cho số lần xảy ra, tỉ lệ và phần trăm biến cố A. Dĩ nhiên phần trăm là tỉ lệ nhân cho 100.

Kiểm định ý nghĩa cho tỉ lệ đơn dùng phân phối nhị thức Xem kết quả của thử nghiệm lâm sàng để so sánh 2 thuốc giảm đau, A và

b. Mười hai người bị migrain được cho thuốc A vào lúc này và thuốc B vào lúc khác, để cho mỗi bệnh nhân được cho mỗi loại thuốc theo thứ tự nghẫu nhiên. Sau đó bệnh nhân được hỏi loại thuốc nào giảm đau tốt hơn. Chín bệnh nhân đáp ứng với thuốc A và 3 bệnh nhân đáp ứng với thuốc B. Ðiều này có nghĩa là thuốc A thực sự hiệu quả hơn hay không hay sự khác nhau chỉ do tình cờ?

Như trong Chương 6 kiểm định ý nghĩa được dùng để quyết định xem cách lý giải nào là khả dĩ hơn. Giả thuyết trung tính là hai thuốc các tác dụng bằng nhau. Nếu điều này đúng, bệnh nhân phải có cơ hội đáp ứng với A và B như nhau (giả thiết rằng có một vài lựa chọn). Phân phối lấy mẫu đối với số lần xuất hiện của đáp ứng với thuốc A phải là phân phối nhị thức với p =0,5 và n = 12.

Chương 6 cho biết mức ý nghĩa là xác suất có kết quả bằng hay cực đoan hơn kết quả quan sát được. Như trong ví dụ này, đó là xác suất xuất hiện đáp ứng với thuốc A là chín, mười, mười một hay mười hai cộng với xác suất xuất hiện đáp ứng với A là ba, hai, một hay không. Trong một kiểm định ý nghĩa 2 đuôi, chúng ta phải tính cả hai đuôi của phân phối. Phân phối nhị thức là phân phối đối xứng với p = 0,5. Do đó trong ví dụ này, xác suất xuất hiện đáp ứng với thuốc A 3 lần cũng bằng với xác suất xuất hiện đáp ứng với thuốc A 9 lần, cũng như

Bảng 12.2 Trung bình dân số và sai số chuẩn của số lần xuất hiện, tỉ lệ và phần trăm của biến cố A trong mẫu

giá trị quan sát trung bình dân số sai số chuẩn Số lần xuất hiện biến cố A r nπ √ {Ûn π(1-p)} Tỉ lệ của A p=r/n π √�π (1-π)/n} Phần trăm biến cố A 100p 100π 100 √ {π(1-π)/n}

Page 65: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

TỈ LỆ

61

trong 12 tung một đồng tiền thì có khả năng có 3 lần ngửa và 9 lần xấp cũng bằng 9 lần ngửa và 3 lần xấp.

Xác suất xuất hiện chín, mười, mười một hay mười hai đáp ứng với A được ghi ở bảng 12.3 và tổng số là 0,0729. Xác suất xuất hiện (3,2,1,0) đáp ứng với thuốc A theo hướng khác cũng là 0,0729. Do đó xác suất có kết quả bằng hay lớn hơn xuất hiện 9 đáp ứng với thuốc A từ 12 bệnh nhân do tình cờ là 0,1458 hay 14,48%. Bởi vì xác suất này quá lớn chúng ta kết luận rằng thử nghiệm không xác định sự khác biệt có ý nghĩa về hiệu quả các thuốc.

Page 66: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

62

Hình 12.3 Phân phối nhị thức cho các giá trị các nhau của p và n. Các giá trị trên trục hoành là r.

Tính toán mức ý nghĩa khi p ≠ 0,5

Nói chung, chúng ta có thể dùng phương pháp trên để kiểm định ý nghĩa của sự khác biệt giữa tỉ lệ của mẫu, p với bất kì giá trị giả thuyết trung tính của tỉ lệ dân số, p. Dù vậy khi p không phải là 0,5 thì phân phối nhị thức không đối xứng và xác suất của đuôi trên và đuôi dưới không giống nhau. Ta có thể tính mức ý nghĩa bằng cách cộng vào (i) xác suất của giá trị mẫu quan sát được và các giá trị cực đoan hơn theo hướng đó và (ii) xác suất của mỗi giá trị theo hướng ngược lại mà những xác suất này nhỏ hơn xác suất của mẫu quan sát được. Theo cách khác là ta có thể tính tổng các xác suất theo hướng quan sát, đó là xác suất (i) và

Page 67: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

TỈ LỆ

63

nhân đôi nó. Kết quả khác nhau nhưng trên thực tế nó không tác động đến việc đánh giá sự khác biệt quan sát được là do tình cờ hay do tác động có thực. Không có phương pháp nào hay hơn phương pháp nào nhưng phương pháp thứ nhì dễ tiến hành hơn.

Bảng 12.3 Tính toán mức ý nghĩa cho thử nghiệm lâm sàng trong đó 9 trong 12 bệnh nhân thích thuốc A hơn thuốc B

Số bệnh nhân thích thuốc A Xác suất Giá trị quan sát 9 220 × 0,512=0,0537 Các giá trị cực đoan hơn 10 11 12

66 × 0,512=0,0161 12 × 0,512=0,0029

1 × 0,512=0,0002 Tổng cộng: 9,10,11,12 0,0729 Ðuôi ngược lại: 3,2,1,0 0,0729 Tổng số (mức ý nghĩa ở hai đuôi) 0,1458

Xấp xỉ phân phối bình thường của phân phối nhị thức Khi cỡ mẫu,n , lớn tính toán xác suất cho mỗi giá trị của một đuôi của phân phối nhị thức để tính kiểm định ý nghĩa có thể rất mất công. May mắn thay khi n tăng phân phối nhị thức trở thành rất gần với phân phối bình thường (xem Hình 12.2). Trong thực tế, phân phối bình thường là xấp xỉ hợp lí của phân phối nhị thức nếu cả np và n-np lớn hơn hoặc bằng 5. Phân phối xấp xỉ bình thường có trung bình và độ lệch chuẩn như trong phân phối nhị thức (xem bảng 12.2)

Kiểm định ý nghĩa và khoảng tin cậy dùng xấp xỉ bình thường Phân phối bình thường có thể dùng để kiểm định ý nghĩa tỉ lệ trong cách giống y như chúng ta đã làm để kiểm định ý nghĩa trung bình (xem Chương 6 và 7) và có thể dùng để xây dựng khoảng tin cậy

Kiểm định ý nghĩa dùng tỉ lệ đơn

Kiểm định bình thường cho một tỉ lệ đơn dùng công thức

np

pespZ

/)1().(. ππππ

−−=−=

Thí dụ trong thử nghiệm lâm sàng để so sánh hay loại thuốc đã mô tả ở trên, tỉ lệ của bệnh nhân thích thuốc A là 9/12 = 0,75 so sánh với giá trị giả thuyết trung tính là p = 0,5

12/5.05.05.075.0

×−=Z

Giá trị 1,73 nằm ở giữa điểm 5 và 10% cua phân phối bình thường chuẩn (Bảng A2). Mức ý nghĩa chính xác của nó có thể được tính từ bảng Bảng A1 và là 2 (0,0418=0,0836 hay 8,36%. Số này nhỏ hơn đáng kể so với giá trị 14,58% đươc tính từ xác suất nhị thức. Lí do là chúng ta đã dùng phân phối liên tục, phân phối bình thường, để xấp xỉ một phân phối rời rạc, phân phối nhị thức. Tình huống này được hiệu chỉnh bằng cách đưa cái gọi là hiệu chỉnh tính liên tục (continuity correction) vào công thức kiểm định bình thường

nnpz

/)1()2/(1||

πππ−−−

=

Page 68: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

64

Trong đó |p-p| có nghĩa là giá trị tuyệt đối của p - p hay nói cách khác đó là p - p không tính đến dấu trừ nếu có.

0,0

0,1

0,2

0,3

0 1 2 3 4 5 6 7 8 9 10 11 12

Hình 12.3 Phân phối nhị thức (n=12, p =0,5) ứng dụng để tính số bệnh nhân thích thuốc A, cùng với xấp xỉ bình thường của nó. Các vùng gạch chéo cho thấy xác suất số bệnh nhân thích thuốc A lớn hơn hay bằng 9 và minh họa việc sử dụng hiệu chỉnh tính liên tục.

Tác động của hiệu chỉnh tính liên tục là giảm giá trị z và cải thiện cho nó phù hợp với phân phối nhị thức. Trong thí dụ này, giá trị z có hiệu chỉnh tính liên tục là

{ } 44,112/5,05,0

24/1|5,075,0| =×

−−=z

Từ bảng A1, mức ý nghĩa của z = 1,44 là 2 × 0,0749=0,1498 hay 14,98% khá phù hợp giá trị 14,58% từ kiểm định nhị thức.

Lí luận của hiệu chỉnh liên tục có thể được hiểu rất rõ nhờ hình 12.3 trong đó phân phối bình thường và nhị thức được đặt chồng lên nhau. Cái mà ta đã làm khi hiệu chỉnh tính liên tục trên thực tế chính là tính toán vùng ở dưới phân phối bình thường bên trái r = 3,5 và bên phải r = 8,5, thay vì bên trái r = 3 và bên phải r = 9. Có thể thấy rằng nó phù hợp hơn với vùng gạch chéo thể hiện đuôi của phân phối nhị thức.

Khoảng tin cậy cho tỉ lệ đơn

Dùng phân phối nhị thức để rút ra khoảng tin cậy cho tỉ lệ rất phức tạp. Dù vậy người ta đã lập bảng các khoảng trong Geigy Scientific Tables (1982) cho các tỉ lệ khác nhau và cho cỡ mẫu tới 100. Một cách khác là dùng công thức xấp xỉ bằng cách sử dụng phân phối bình thường và phương pháp tương tự như đã mô tả ở Chương 5. Nó cho công thức

c.i. = p ± z' × s.e., s.e. = √[Ûp(1-p)/n] Trong đó z' là điểm phần trăm tương ứng của phân phối bình thường chuẩn. Thí dụ đối với khoảng tin cậy 95% z'=1,96. Công thức này không được hiệu chỉnh tính liên tục và chỉ thích hợp khi cả np và n-np lớn hơn hoặc bằng 10.

Kiểm định ý nghĩa so sánh hai tỉ lệ

Kiểm định bình thường để so sánh hai tỉ lệ mẫu, p1=r1/n1 và p2=r2/n2 dựa trên

).(. 21

21

ppesppz−

= −

Trong só sai số chuẩn của p1-p2 dưới giả thuyết trung tính nghĩa là tỉ lệ dân số bằng nhau (p1=p2=p) là:

Page 69: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

TỈ LỆ

65

)/1/1)(1().(. 2121 nnppes +−=− ππ

p là ước lượng tỉ lệ toàn bộ của cả hai mẫu đó là:

21

21

nnrrp

++=

Nhưng trong trường hợp tỉ lệ đơn, kiểm định được cải thiện nhờ việc đưa vào hiệu chỉnh tính liên tục. Công thức là

{ }

21

21

21

2121 ,)/1/1)(1(

)2/(1)2/(1||nnrrp

nnppnnppz

++=

+−+−−=

(Như đã trình bày ở trên, |p1-p2| là kích thước của hiệu số, bỏ qua dấu của nó). Kiểm định bình thường này là một xấp xỉ hợp lí cho hoặc là (i) n1+n2 lớn hơn 40 hay (ii) n1p, n1-n1p, n2p, n2-n2p đều lớn hơn hoặc bằng 5. Kiểm định chính xác được mô tả ở Chương 4 khi điều kiện không được thỏa mãn.

Khoảng tin cậy cho hiệu số giữa hai tỉ lệ

Công thức tính khoảng tin cậy cho hiệu số giữa 2 tỉ lệ là

22211121 /)1(/)1(...),.'()(.. nppnppeseszppic −+−=×±−=

Trong đó z là điểm phần trăm thích hợp của phân phối bình thường. Xấp xỉ này hợp lí nếu n1p, n1-n1p, n2p, n2-n2p đều lớn hơn hoặc bằng 10 và sẽ tốt hơn nếu những số này lớn hơn.

Thí dụ 12.2

Xét kết quả của một thử nghiệm vaccin cúm được tiến hành trong một vụ dịch. Hai mươi trong 240 (p1=0,083 hay 8,3%) người được tiêm chủng vaccin thực mắc bệnh cúm so với 80 trong số 220 người(p2=0,364 hay 36,4%) người được chích placebo. Ðây có phải là bằng chứng thuyết phục rằng vaccin có hiệu quả.

Tỉ lệ toàn bộ mắc cúm là

%7,21217,0460100

2202408020 hay ==

++=p

Và như vậy

18,70385,0

0044,0281,0)220/1240/1)(217,01(217,0)440/1480/1(|364,0083,0|

=−=

+−+−−=z

Giá trị 7,18 lớn hơn 3,29 là điểm 0,1% cho phân phối bình thường chuẩn. Do đó chúng ta kết luận rằng giảm nguy cơ nhiễm cúm sau khi tiêm chủng vaccin thật với mức ý nghĩa cao (P<0,001). Khoảng tin cậy của mức giảm là:

208,0;354,0)037,096,1(281,0/)1(/)1(96,1)( 22211121

−−=×±−=−+−±− nppnpppp

Nghĩa làm xác suất mắc cúm được ước lượng thấp hơn 20,8% đến 35,4% sau khi tiêm chủng vaccin cúm so với tiêm placebo.

Page 70: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

66

Thí dụ này được minh họa một lần nữa ở Chương tiếp theo và trong phần thử nghiệm vaccin ở Chương 25, ở đó đưa vào khái niệm hiệu quả vaccin.

Page 71: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

KIỂM ÐỊNH CHI BÌNH PHƯƠNG CHO BẢNG DỰ TRÙ

67

KIỂM ÐỊNH CHI BÌNH PHƯƠNG CHO BẢNG DỰ TRÙ

Giới thiệu Trình bày số liệu của các biến định tính được mô tả ở Chương 2. Khi có hai biến định tính, số liệu được sắp xếp trong bảng dự trù (contigency table). Các phạm trù cho một biến số tạo thành hàng và các phạm trù cho biến số khác tạo thành cột. Cá nhân được đưa vào một ô thích hợp của bảng dự trù tùy theo giá trị của hai biến số. Bảng dự trù cũng được dùng cho các biến số định lượng rời rạ hay biến số định lượng liên tục khi các giá trị được phân nhóm.

Kiểm định chi bình phương (χ2) được dùng để kiểm định xem có sự liên hệ giữa các biến số hàng và biến số cột hay không hay nói cách khác, sự phân phối của các cá nhân trong các phạm trù của một biến số có phụ thuộc vào sự phân phối trong các phạm trù của biến kia hay không. Khi bảng chỉ có hai hàng và hai cột điều này có nghĩa là so sánh 2 tỉ lệ.

Bảng 2 × 2 (so sánh hai tỉ lệ) Kết quả của thử nghiệm cúm được mô tả ở Thí dụ 12.2 được sắp xếp trong theo dạng bảng trong Bảng 13.1(a). Trong 460 người lớn, 240 người được tiêm chủng vaccin cúm và 220 người được tiêm placebo. Tổng số 100 người bị cúm trong đó có 20 người ở trong nhóm vaccin và 80 người ở trong nhóm placebo. Bảng đó được gọi là bảng dự trù 2 × 2 (2 × 2 contigency table). Bởi vì hai biến số đó, loại vaccin và sự xuất hiện cúm, đều có 2 giá trị khả dĩ. Ðôi khi nó được gọi là bảng gấp 4 (fourfold table) bởi vì các đối tượng sẽ ở một bốn phạm trù khả dĩ.

Bước đầu tiên trong việc lí giải số liệu bảng dự trù là tính toán tỉ lệ hay phần trăm thích hợp. Do đó tỉ lệ mắc cúm là 8,3% trong nhóm vaccin, 36,4% trong nhóm placebo và 21,7% toàn bộ. Sau đó chúng ta cần quyết định như vậy có đủ chứng cứ để xem vaccin có hiệu quả hay sự khác biệt là do tình cờ.

Ðiều này được tiến hành bằng kiểm định chi bình phương (chi square test) nhằm so sánh số quan sát trong một trong bốn phạm trù trong bảng dự trù với số kì vọng nếu không có sự khác biệt về hiệu quả giữa vaccine và placebo. Tổng số 100/460 người bị cúm và nếu vaccine và placebo có hiệu quả bằng nhau, tỉ lệ bị cúm trong hai nhóm cũng như vậy và có 100/460×240=52,2 người trong nhóm vaccine và 100/460 × 220=47,8 người trong nhóm placebo sẽ bị cúm. Tương tư như vậy sẽ có 360/460 × 240 =187,8 người và 360/480 × 220 người không bị cúm. Những số kì vọng này đươc trình bày trong bảng 13.1(b). Chúng cũng tạo tổng số hàng và tổng số cột tương tự như trị số quan sát. Giá trị chi bình phương có được bằng cách tính (quan sát - kì vọng)2/kì vọng cho mỗi ô trong bảng dự trù và cộng chúng lại.

2 x 2 baíng våïi âäúi 1..,)( 22 =−Σ= fd

EEOχ

Hiệu số giữa số quan sát được và số kì vọng càng lớn, giá trị χ2 càng lớn và ít có thể sự khác biệt này là do tình cờ. Ðiểm phần trăm của phân phối χ2 được trình bày trong bảng A5. Giá trị này phụ thuộc vào độ tự do và trong bảng 2 × 2 độ tự do bằng 1.

Trong thí dụ này

09,5302,652,569,2186,192,172

)2,172140(8,187

)8,187220(8,47

)8,4780(2,52

)2,5220( 22222

=+++=

−+−+−+−=χ

53,09 lớn hơn 10,85, điểm 0,1% của phân phối χ2 một độ tự do. Do đó xác suất của sự khác biệt quan sát được về bệnh cúm do tình cờ nhỏ hơn 0,1%, nếu không có sự khác biệt thực sự giữa vaccine và placebo. Do đó có thể kết luận rằng vaccin có hiệu quả.

Page 72: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

68

Sự hiệu chỉnh tính liên tục

Giống như kiểm định bình thường, kiểm định chi bình phương đối với bảng 2 × 2 có thể được cải tiến nhờ hiệu chỉnh tính liên tục, thường được gọi là hiệu chỉnh tính liên tục của Yates (Yates' continuity correction). Công thức như sau

1..,|(| 21

2 =−−Σ= fdEEOχ

cho giá trị χ2 nhỏ hơn, |O-E| có nghĩa là giá trị tuyệt đối của O-E hay nói cách khác, giá trị của O-E bỏ qua dấu của nó.

Trong thí dụ này giá trị của χ2 làì

001,046,5184,535,502,2125,192,172

)2,32(8,187

)2,32(8,47

)2,32(2,52

)32( 2212

212

212

21

2

<=+++=

−+−+−+−=

P

χ

So sánh với kiểm định bình thường

Kiểm định bình thường để so sánh hai tỉ lệ và kiểm định chi bình phương cho bảng dự trù 2 × 2 thực chất là tương đương với nhau và χ2 = z2. Ðiều này đúng với cả khi có hay không có hiệu chỉnh tính liên tục, với điều kiện là nó cùng hiệu chỉnh hoặc không cùng hiệu chỉnh. Từ thí dụ 12.2, z2 với (hiệu chỉnh tính liên tục) = 7,182 = 51,55 mà ngoại trừ sai số làm tròn nó giống hệt như giá trị χ2 = 51,46 đã được tính ở trên. Kiểm định bình thường có ưu điểm là dễ tính khoảng tin cậy hơn. Dù vậy kiểm định χ2 dễ áp dụng hơn và có thể mở rộng để so sánh nhiều tỉ lệ và dùng cho bảng dự trù lớn hơn.

Lưu ý rằng điểm phần trăm trong Bảng A5 cho kiểm định chi bình phương một độ tự do tương ứng với điểm phần trăm hai đuôi trong bảng A2 của phân phối bình thường. (Khái niệm kiểm định một đuôi hay hai đuôi không dùng đối với kiểm định chi bình phương có độ tự do lớn hơn bởi vì chúng bao gồm việc so sánh nhiều tỉ lệ (multiple comparison).)

Tính hợp lệ (validity)

Nên luôn luôn sử dụng hiệu chỉnh tính liên tục mặc dù chúng có tác động nhiều nhất khi số kì vọng nhỏ. Khi chúng rất nhỏ kiểm định chi bình phương (và kiểm định bình thường) không phải là xấp xỉ tốt, ngay cả khi có hiệu chỉnh tính liên tục và khi đó nên dùng kiểm định chính xác (exact test) cho bảng 2 × 2 (xem Chương 14). Cochran (1954) đề nghị sử dụng kiểm định

Bảng 13.1 Kết quả thử nghiệm vaccine cúm

(a) Số quan sát Cúm vaccine placebo tổng số có 20 (8,3%) 80 (36,4%) 100 (21,7%)

không 220 140 360 tổng số 240 220 460

(a) Số kì vọng cúm vaccine placebo tổng số có 52,2 47,8 100

không 187,8 172,2 360 tổng số 240 220 460

Page 73: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

KIỂM ÐỊNH CHI BÌNH PHƯƠNG CHO BẢNG DỰ TRÙ

69

chính xác khi tổng số của bảng nhỏ hơn 20 hay khi nó ở giữa 20 và 40 và số nhỏ nhất trong bốn giá trị kì vọng nhỏ hơn 5. Do đó kiểm định chi bình phương hợp lệ khi tổng số phải lớn hơn 40 bất kể các giá trị kì vọng hay khi tổng số kì vọng ở giữa 20 và 40 với điều kiện tất cả các giá trị kì vọng phải lớn hơn hoặc bằng 5.

Công thức tính nhanh

Nếu các số trong bảng dự trù được kí hiệu bằng các kí tự như trong bảng 13.2 thì công thức để tính chi bình phương nhanh hơn cho bảng 2 × 2 như sau:

01,53220240360100

)2208014020(460)( 222 =

××××−××=−=

efghbcadnχ

Mà ngoại trừ sai số làm tròn sẽ giống hệt như giá trị đã tính ở trên. Với hiệu chỉnh tính liên tục, công thức sẽ trở thành

1..,)2/|(| 22 =−−= fd

efghnbcadnχ

Trong thí dụ này

37,51220240360100

)23014800(460 22 =

×××−×=χ

Kết quả này tương tự như như giá trị đã tính ở trên, nếu không xét đến sai số làm tròn.

Bảng lớn

Kiểm định chi bình phương có thể được áp dụng cho bảng lớn hơn, nói chung là bảng r × c, trong đó r kí hiệu số hàng trong bảng và c là số cột.

)1()1(..,)( 22 −×−=−Σ= crfd

EEOχ

Và không có hiệu chỉnh tính liên tục hay kiểm định chính xác cho bảng dự trù ngoại trừ bảng 2 × 2 . Cochran (1954) đã đề nghị rằng xấp xỉ của kiểm định chi bình phương sẽ hợp lệ nếu có ít hơn 20% số các giá trị kì vọng dưới 5 và không có giá trị kì vọng nào nhỏ hơn một. Có thể vượt qua hạn chế này bằng cách kết hợp các hàng (hay các cột) có giá trị kì vọng thấp.

Không có công thức tính nhanh cho bảng r × c (trường hợp đặc biệt 2 × c hay r × 2 sẽ được xét ở phần sau). Phải tính số kì vọng cho mỗi ô. Sử dụng các lí luận y như trong trường hợp bảng 2 × 2 . Qui tắc chung để tính số kì vọng là:

chung säútäøng

haìng cuíatäøng cäüt cuíatäøng ×=E

Cần lưu ý rằng kiểm định chi bình phương chỉ hợp lệ nếu được áp dụng cho số thực tế trong các phạm trù khác nhau. Không bao giờ được áp dụng nó cho bảng chỉ có tỉ lệ hay phần trăm mà thôi.

Bảng 13.2 Kí hiệu tổng quát cho bảng dự trù 2 × 2

Cúm vaccin placebo tổng số Có a b e Không c d f tổng số g h n

Page 74: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

70

Thí dụ 13.1

Bảng 13.3(a) trình bày kết quả của cuộc điều tra so sánh nguồn nước chính trong 3 xã ở Tây châu Phi. Trong bảng trình bày số và phần trăm các gia đình dùng, nước sông, nước ao, hay suối. Thí dụ trong làng A, 40% sử dụng nước sông chủ yếu, 36% nước ao hồ, 24,0% sử dụng giếng. Việc tính toán các phần trăm là cần thiết trong việc lí giải số liệu của bảng dự trù. Nói chung, 70 trong 150 hộ dùng nước giếng. Nếu không có sự khác biệt giữa các làng, người ta có thể cho rằng tỉ lệ dùng nước sông là giống nhau trong mỗi làng. Do đó số kì vọng của số hộ dùng nước sống là

70 × 50/150 = 23,3 70 × 60/150= 28,0 70 × 40/150 = 18,7 Số kì vọng có thể được tính bằng cách áp dụng quy tắc chung. Thí dụ số kì vọng của hộ dùng nước sống trong làng B là:

0,28150

6070 =×=×chung säútäøng

(B) cäüt cuíatäøng (säng)haìng cuíatäøng

Số kì vọng của toàn bộ bảng được trình bày trong bảng 13.3(b)

422)1()1(53,3

080810012012801001012313312120200202071671618

718718180280283232332320

)(

222

222

222

22

=×=−×−==

++

++++++=

−Σ=

crdf

,/),- ( ,/),- ( ,/),-( ,/),- ( ,/),- ( ,/),-(

,/),- ( ,/),- ( ,/),-(E

EOχ

Bởi vì 3,53 nhỏ hơn 5,39 (điểm 25% của χ2 4 độ tự do), có thể kết luận rằng không có sự khác biệt ý nghĩa giữa các làng về phần trăm số hộ dùng các nguồn nước khá nhau (P>0,25)

Bảng 13.3 So sánh các nguồn nước chính được sử dụng bởi gia đình trong 3 làng ở Tây phi

(a) Số quan sát NGUồN NƯớC LÀNG A LÀNG B LÀNG C TổNG Số Sông 20(40,0%) 32(53,3%) 18(45,0%) 70(46,7%) Ao hồ 18(36,0%) 20(33,3%) 12(30,0%) 70(33,3%) Suối 12(24,0%) 8(13,3%) 10(25,0%) 30(20,0%) Tổng số 50(100,0%) 60(100,0%) 40(100,0%) 150(100,0%) (b) Số kì vọng NGUồN NƯớC LÀNG A LÀNG B LÀNG C TổNG Số Sông 23,3 28,0 18,7 70 Ao hồ 16,7 20,0 13,3 50 Suối 10,0 12,0 8,0 30 Tổng số 50 60 40 150

Page 75: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

KIỂM ÐỊNH CHI BÌNH PHƯƠNG CHO BẢNG DỰ TRÙ

71

Công thức ngắn gọn cho bảng 2 × c Kiểm định chi bình phương được áp dụng cho bảng 2 × c , đó là bảng chỉ có 2 hàng trình bày sự khác biệt giữa c tỉ lệ thể hiện bởi c cột trong bảng. Công thức cô đọng hơn trong trường hợp này

1..,)(

]/)/([ 2222 −=

−−Σ= cfdRNR

NRnrNχ

Trong đó n thể hiện tổng số cho cột và r là giá trị của ô trên trong cột đó. r2/n được tính cho mỗi cột trong bảng và tổng của chúng là Σ (r2/n). N là tổng số toàn bộ và R là tổng số cả hàng trên. (đối với bảng có 2 cột chứ không phải hai hàng, từ 'cột' và 'hàng' sẽ đổi chỗ cho nhau trong phần trình bày trên.)

Thí dụ 13.2

Bảng 13.4 trình bày kết quả cuộc điều tra ở một vùng nông thôn ở Trung Phi để so sánh suất mắc toàn bộ Schistosoma mansoni trong các nghề nghiệp khác nhau. Áp dụng công thức ngắn gọn cho χ2:

3..05,119075

09348336165209,34165/75/

83367679842610831329152581724321235222

2

22

2

==×

=

===+++=+++=Σ

fd),-,(NR

, , , , , / / / / /n) (r

χ

Ðiều này có ý nghĩa ở mức 2,5%, gợi ý rằng có thể có sự liên hệ giữa nguy cơ nhiễm bệnh và nghề nghiệp. Suất mắc toàn bộ của S. mansoni cao ở người ngư dân, thấp ở người buôn bán so với nông dân và thợ thủ công.

Bảng 13.4 Suất mắc toàn bộ của Schistosoma mansoni theo nghề nghiệp

S. Manosi

Ngư dân

Nông dân

Nghề nghiệp Buôn bán

thợ thủ công

tổng số

Dương tính 22(62,9%) 21 (48,8%) 17 (29,3%) 15 (51,7%) 75 (45,5%) Âm tính 13 22 41 14 90 Tổng số 35 43 58 29 165

Page 76: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

72

BỔ SUNG MỘT SỐ PHƯƠNG PHÁP CHO BẢNG DỰ TRÙ

Giới thiệu Phân tích bảng dự trù được giới thiệu và kiểm định chi bình phương được mô tả ở Chương 13. Trong chương này chúng ta sẽ mô tả phương pháp cần dùng khi kiểm định chi bình phương đơn giản không thích hợp hay không đủ phân tích số liệu. Phạm trù đầu tiên bao gồm các trường hợp khi mẫu quá nhỏ nên việc xấp xỉ không đúng hay khi so sánh tỉ lệ bắt cặp (xem thí dụ ở bảng 14.3). Phạm trù thứ nhì là việc phân tích kết hợp một số bảng dự trù và tìm kiếm khuynh hướng tăng (hay giảm) đối với bảng tỉ lệ 2 × c .

Kiểm định chính xác cho bảng 2 2 Như đã trình bày trong Chương 13, xấp xỉ của kiểm định chi bình phương và kiểm định bình thường đối với bảng 2 × 2 có thể không hợp lệ nếu cỡ mẫu nhỏ. Cochran (1954) đề nghị sử dụng kiểm định chính xác (exact test), đôi khi đươc gọi là kiểm định chính xác của Fisher khi:

(i) Tổng số chung của bảng nhỏ hơn 20 (ii) Tổng sổ chung từ 20 đến40 và số nhỏ nhất trong 4 số kì vọng nhỏ hơn 5.

Kiểm định được mô tả dễ hiểu nhất trong trường hợp một thí dụ cụ thể. Bảng 14.1 trình bày kết quả từ một nghiên cứu để so sánh hai chế độ điều trị để kiểm soát chảy máu ở người bị hemophili trong khi phẫu thuật. Chỉ có 1 trong số 13 (8%) số người bị hemophili được điều trị bằng chế độ A bị chảy máu, so với 3 trong 12 (25%) người được điều trị bởi chế độ B. Những con số này nhỏ nên kiểm định chi bình phương không thể hợp lệ; tổng số chung là 25, nhỏ hơn 40 và số kì vọng nhỏ nhất là 1,9 (biến chứng trong chế độ điều trị B) nhỏ hơn 5. Do đó cần dùng kiểm định chính xác. Kiểm định chính xác được dựa vào sự tính toán xác suất chính xác của bảng quan sát được và bảng 'cực đoan' hơn (more extreme table) với cùng tổng số hàng và cột, dùng công thức sau

!!!!!

!!!!dcbanhgfe= 2 baíng cuía xaïcchênh suáút Xaïc

Trong đó kí hiệu đã đươc định nghĩa ở Bảng 13.2. Dấu chấm than kí hiệu giai thừa của một số và có nghĩa là nhân tất cả các số nguyên từ số đó tới 1 với nhau. (0! được định nghĩa là 1). Nhiều máy tính cầm tay có phím bấm giai thừa, mặc dù biểu thức này có thể dễ dàng tính toán bằng cách đơn giản các thừa số ở tử và mẫu số. Xác suất chính xác cho bảng 14.1 là

2261,022232425101112134

!9!12!3!1!25!12!13!21!4 =

×××××××=

(21! được đơn giản với 25! thành 25 × 24 × 23 × 22).

Bảng 14.1 So sánh hai chế độ điều trị để kiểm soát chảy máu ở người bị bệnh hemophili trong phẫu thuật

chế độ điều trị Biến chứng chảy máu A B Tổng số

có 1 3 4 không 12 9 21

Tổng số 13 12 25

Page 77: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

BỔ SUNG MỘT SỐ PHƯƠNG PHÁP CHO BẢNG DỰ TRÙ

73

Ðể kiểm định giả thuyết trung tính không có sự khác biệt giữa 2 chế độ điều trị, chúng ta cần tính không những xác suất của bảng quan sát được mà cả xác suất của những bảng cực đoan hơn có thể xảy ra tình cờ. Như vậy có 5 bảng có thể có mà có cùng tổng số hàng và cột như trong số liệu. Chúng được trình bày ở bảng 14.2 cùng với xác suất của nó. Trường hợp quan sát được ở bảng 14.2(b) với xác suất 0.2261. Với nhận định rằng cực đoan hơn nghĩa là kém khả năng hơn, bảng 14.2(a) và 14.2(e) cực đoan hơn với xác suất tương ứng là 0,0391 và 0,0565. Tổng các xác suất cần cho mức ý nghĩa là 0,2261 + 0,0391 + 0,0565 = 0,3217 và do đó sự khác biệt giữa các chế độ là không có ý nghĩa.

hån nhoí suáút xaïccoï baíng caïc cuía suáút xaïc âæåüc saït quan baíng cuía suáút xaïc

I) (caïchnghéa yïMæïc

+=

Các thứ nhì hạn chế việc tính toán cho các bảng cực đoan cùng hướng với hướng đã quan sát và sau đó nhân đôi xác suất để có cả sự khác biệt theo hướng ngược lại. Trong thí dụ này, mức ý nghĩa thu được sẽ thu được sẽ gấp đôi tổng xác suất của Bảng 14.2(a) và 14.2(b) đó là 2 × (0,0391 + 0,2261) = 0,534. Không có phương pháp nào hay hơn phương pháp kia nhưng phương pháp dễ tiến hành hơn. Mặc dù hai phương pháp cho kết quả khác nhau nhưng trên thực tế cách lựa chọn ít khi tác động đến việc đánh giá xem sự khác biệt là do tình cờ hay là hiệu quả có thực.

+×=tæûtæång hæåïng theo hån âoan cæûc baíng caïc cuía suáút xaïc

âæåüc saït quan baíng cuía suáút xaïc II) (caïch

nghéa yïMæïc

2

So sánh 2 tỉ lệ - trường hợp cặp đôi Trong một số nghiên cứu chúng ta quan tâm đến việc so sánh hai tỉ lệ được tính từ các quan sát được cặp đôi (paired). Ðiều này xảy ra khi hai tỉ lệ cùng được đo lường trên cùng một cá

Bảng 14.2 Những bảng có cùng tổng số hàng và cột như bảng 14.1 và xác suất của chúng

(a) (b) 0 4 4 1 3 4 13 8 21 12 9 21 13 12 25 13 12 25 p = 0,0391 p = 0,2261

(c) (d) 2 2 4 3 1 4 11 10 21 10 11 21 13 12 25 13 12 25 p = 0,4070 p = 0,2713

(e) 4 0 4 9 12 21 13 12 25 p = 0,0565

Page 78: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

74

nhân (xem thí dụ dưới hay từ nghiên cứu bệnh chứng và thử nghiệm lâm sàng trong đó sử dụng quy hoạch bắt cặp đôi (matched paired design) (xem Chương 24 và 25)

Thí dụ, xét kết quả một thử nghiệm so sánh phương pháp Bell và Kato- Katz để phát hiện trứng Schistosoma masoni trong phân gồm 315 bệnh phẩm được phân tích bằng hai phương pháp. Kết quả được trình bày trong bảng dự trù 2 × 2 trong bảng 14.3(a), cho thấy sự phù hợp giữa hai phương pháp. Dù vậy chúng ta không quan tâm đến sự phù hợp ở đạy mà chúng ta quan tâm chủ yếu đến tỉ lệ bệnh phẩm dương tính của hai phương pháp. Ðó là 238/315 (75,6%) khi dùng phương pháp Bell và 198/315 (62,9%) khi dùng phương pháp Kato-Katz. Lưu ýy rằng nếu trình bày số liệu như trong bảng 14.3(b) và áp dụng kiểm định chi bình phương là sai, bởi vì nó không tính đến bản chất cặp đôi của số liệu, đó là cùng 315 bệnh phẩm được xét nghiệm bởi cả hai phương pháp, chứ không phải là 630 bệnh phẩm khác nhau.

Phương pháp đúng như sau. Một trăm tám mươi bốn bệnh phẩm dương tính với cả 2 phương pháp và 63 âm tính với cả hai phương pháp. 274 bệnh phẩm này không cho thông tin nào về phương pháp tốt hơn trong việc phát hiện trứng S. mansoni. Thông tin mà chúng ta cần đến hoàn toàn nằm trong 69 trường hợp mà hai phương pháp không phù hợp. Trong số này có 54 trường hợp chỉ dương tính với phương pháp Bell so với 14 chỉ dương tính với phương pháp Kato-Katz.

Nếu không có sự khác biệt về khả năng phát hiện trứng S. Masoni, chúng ta sẽ không kì vọng sự phù hợp hoàn toàn bởi vì đó là 2 mẫu khác nhau, nhưng chúng ta kì vọng rằng có một phân nửa trường hợp không phù hợp sẽ chỉ dương tính với phương pháp Bell mà thôi và phân nửa sẽ chỉ dương tính với phương pháp Kato-Katz. Do đó kiểm định ý nghĩa thích hợp là so sánh tỉ lệ chỉ dương tính với phương pháp Bell (54/68) với giá trị giả thuyết là 0,5. Ðiều này có thể làm được nhờ kiểm định bình thường (với hiệu chỉnh tính liên tục) như đã được trình bày trong Chương 12. Nó tính ra

73,468/5,05,0

)682/(1|5,068/54| =×

×−−=z

Nói lên rằng phương pháp Bell tốt hơn có ý nghĩa (P<0,001) hơn phương pháp Kato-Katz trong việc phát hiện trứng S. masoni. (Lưu ý rằng sẽ thu được kết quả tương tự nếu so sánh tỉ lệ chỉ dương tính với Kato-Katz, đó là 14/68, được so sánh với 0,5.)

Kiểm định chi bình phương McNemar

Có kiểm định chi bình phương, được gọi là kiểm định chi bình phương McNemar (McNemar's chi squared test), dựa trên số các cặp không phù hợp (discordant pairs), r và s. Công thức có hiệu chỉnh tính liên tục là:

1..,)1|(| 22 =

+−−= fdsr

srcàûp bàõtχ

Bảng 14.3 So sánh phương pháp Bell và Kato-Katz để phát hiện trứng Schistosoma mansoni trong phâm. 315 bệnh phẩm được xét nghiệm bằng cả hai phương pháp. Số liệu từ Sleigh et al. (1982) Transaction of the Royal Society of Tropical Medicine and Hygiene 76, 403-6 (đã xin phép)

(a) Trình bày đúng (b) Trình bày sai Kato-Katz + - Tổng số Kết quả Bell Kato-Katz Tổng số

Bell + 184 54 238 + 238 198 436 - 14 63 77 - 77 117 194

Tổng số 198 117 315 Tổng số 315 215 630

Page 79: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

BỔ SUNG MỘT SỐ PHƯƠNG PHÁP CHO BẢNG DỰ TRÙ

75

Trong thí dụ r = 54 và s = 14 cho

001,0,1..36,226839

1454)1|1454(| 22

2 <===+

−−= Pfdcàûp bàõtχ

Ngoại trừ sai số làm tròn, giá trị χ2 này giống hệt như với bình phương giá trị z có được ở trên (4,732 = 22,37), hai kiểm định tương đương về mặt toán học với nhau.

Tính hợp lệ

Sử dụng kiểm định chi bình phương McNemar hay kiểm định bình thường hợp lệ nếu tổng số các cặp không phù hợp phải lớn hơn hoặc bằng 10. Nếu có ít hơn 10 cặp không phù hợp, phải tính xác suất nhị thức chính xác như đã trình bày ở Chương 12.

Khoảng tin cậy

Tỉ lệ mẫu dương tính với phương pháp Bell là 0,7556 so với 0,6286 của phương pháp Kato-Katz. Hiệu số của hai tỉ lệ này là 0,1270. Hiệu số này cũng như sai số chuẩn của nó có thể được tính từ số các cặp không phù hợp, r và s và tổng số các cặp n.

nsres

nsr +=−= ..,

càûp bàõtlãû tè haicuía säú Hiãûu

Ở đây sự khác biệt, (r-s)/n= 40/315=0.1270 giống như khi được tính trực tiếp từ tỉ lệ, với s.e. = (√ 68)/315=0,0262. Khoảng tin cập xấp xỉ có thể được tính dựa trên phân phối bình thường.

nsrz

nsric +±−= '..

Khoảng tin cậy 95% của hiệu số giữa tỉ lệ của bệnh phẩm dương tính với phương pháp Bell và Kato-Katz là:

0,1270 ± 1,96 × 0,0262 = 0,0756 đến 0,1784 Ðiều này có nghĩa là tỉ suất dương tính cao hơn từ 7,6% và 17,8% khi dùng phương pháp Bell để phát hiện trứng S. mansoni so với khi dùng phương pháp Kato-Katz.

Phân tích nhiều bảng 2 × 2 Một điểm tổng quát rất quan trọng cần phải nhận thức khi tiến hành phân tích là khi tập hợp (pool) nhiều tập hợp số liệu có thể dãn đến kết quả sai lạc. Thí dụ, xét một kết quả được trình bày ở bảng 14.4 từ một cuộc điều tra được tiến hành để so sánh tỷ suất mắc toàn bộ của kháng thể chống leptospirosis ở nông thôn và thành thị ở vùng West Indies. Ðiểm chính cần lưu ý ở đây là đối với nam hay nữ, tỷ suất mắc toàn bộ cao ở vùng nông thôn nhưng khi kết hợp hai giới tính thì không có sự khác biệt. Ðiều này là do sự kết hợp của hai yếu tố

(i) tỷ suất mắc toàn bộ của kháng thể không giống nhau ở nam và nữ. Nó thấp ở nữ, dù rằng ở nông thôn hay thành thị.

(ii) Mẫu từ vùng nông thôn và thành thị có cấu trúc giới tính khác nhau. Tỉ lệ nam là 100/200 (50%) ở mẫu thành thị nhưng chỉ có 50/200 (25%) ở mẫu nông thôn.

Page 80: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

76

Giới tính được gọi là biến số gây nhiễu (confounding variable) bởi vì nó có quan hệ của với biến số cần quan tâm (tỷ suất mắc toàn bộ của kháng thể) và nhóm được so sánh (thành thị và nông thôn). Nếu trong khi phân tích bỏ qua giới tính sẽ dẫn đến kết quả sai lệch. Do đó điều quan trọng là phân tích nam riêng, nữ riêng. Áp dụng kiểm định chi bình phương cho sự khác biệt giữa nông thôn và thành thị có ý nghĩa ở nam nhưng không có ý nghĩa ở nữ giới (Bảng 14.4). Kiểm định tổng kết (summary test) nhằm kết hợp hai mảng thông tin này được mô tả ở dưới và phương pháp chuẩn hóa để điều chỉnh tỉ lệ toàn bộ để phản ánh sự khác biệt về giới tính được trình bày ở Chương 15.

Trong trường hợp này, sự kết hợp số liệu của 2 giới tính sẽ che dấu sự khác biệt có thực. Trong một số tình huống khác, sự kết hợp những nhóm số liệu khác nhau có thể cho thấy sự khác biệt trong khi nó không tồn tại, thậm chí cho thấy sự khác biệt ngược với sự khác biệt có thực. Một thí dụ khác là việc đánh giá xem người bị nhiễm schistosoma có tỉ suất tử vong cao hơn người không bị nhiễm hay không. Trong trường hợp này cần phải tính đến tuổi bởi vì cả nguy cơ chết và nguy cơ bị nhiễm schistosoma đều gia tăng với tuổi. Nếu không xét đến tuổi, nhiễm schistosoma sẽ dường như sẽ có tỉ suất tử vong cao hơn, ngay cả khi nếu điều này không xảy ra trong thực tế, bởi vì những người bị nhiễm schistosoma thường lớn tuổi hơn và do đó có nhiều khả năng bị chết hơn so với những người trẻ không bị nhiễm schistosoma.

Kiểm định chi bình phương Mantel-Haenszel

Khi có biến số gây nhiễu, điều quan trọng là phải phân tích riêng biệt từng nhóm nhỏ các số liệu thích hợp. Dù vậy, cũng cần áp dụng một kiểm định có thể kết hợp tất cả các chứng cứ từ các nhóm riêng biệt nhưng có tính đến yếu tố gây nhiễu. Ðiều này đặc biệt đúng khi có sự khác biệt nhưng không có ý nghĩa ở trong từng nhóm nhỏ, bởi vì có thể là do cỡ mẫu nhỏ. Kiểm định chi bình phương Mantel Haenszel được dùng cho mục đích này khi số liệu chỉ gồm vài bảng 2 × 2 . Tính ba giá trị sau đây từ mỗi bảng và lấy tổng trên các bảng (kí hiệu được định nghĩa trong bảng 13.2):

Bảng �1 So sánh tỉ suất mắc toàn bộ của kháng thế chống leptospiro ở giữa vùng thành thị và nông thôn.

(a) Ðàn ông Kháng thể Nông thôn Thành thị Tổng số Có 36 (72%) 50 (50%) 86 Không 14 50 64 Tổng số 50 100 150

χ2 = 5,73 d.f.=1 P<0,025 (b) Ðàn bà Kháng thể Nông thôn Thành thị Tổng số Có 24 (16%) 10 (10 34 Không 126 90 216 Tổng số 150 100 250

χ2 = 1,36 d.f.=1 P ≈ 0,25 (c) Ðàn ông và đàn bà Kháng thể Nông thôn Thành thị Tổng số Có 60 (30%) 60 (30%) 120 Không 140 140 280 Tổng số 200 200 400

Page 81: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

BỔ SUNG MỘT SỐ PHƯƠNG PHÁP CHO BẢNG DỰ TRÙ

77

(i) giá trị quan sát a (ii) giá trị kì vọng của a, Ea=eg/n và (iii) phương sai của a, Va=efgh/[n2(n-1)]

Giá trị chi bình phương (có hiệu chỉnh tính liên tục) là:

1..,)5,0|(| 22 =

Σ−Σ−Σ= fd

VEa

a

aMHχ

Lưu ý rằng nó chỉ có một độ tự do dù rằng nó tổng kết bao nhiêu bảng

Việc tính toán số liệu ở bảng 14.4 đươc trình bày trong bảng 14.5(a). Tổng số 60 người trong vùng nông thôn có kháng thể chống lại Leptospira so với số kì vọng là 49,1, dựa trên giả định không có sự khác biệt về tần suất mắc toàn bộ giữa nông thôn và thành thị. Giá trị χ2 Mantel-Haenszel bằng 7,08 và có ý nghĩa ở mức 1%.

01,0,1..08,72874,15

4,102874,15

)5,0|1,4960(| 222 <===−−= Pfdχ

Có vẻ kì lạ là dường như kiểm định chỉ dựa hoàn toàn vào giá trị quan sát và giá trị kì vọng của a và không dựa vào các ô khác trong bảng. Dù vậy điều này không hẳn như vậy, bởi vì một khi có được giá trị a có thể tính được giá trị b, c, d từ các tổng số trong bảng. Nếu kiểm định Mantel-Haenszel được áp dụng cho bảng 2 × 2 thì giá trị χ2 thu được sẽ gần với nhưng không chính xác bằng với giá trị χ2 chuẩn. Nó hơn nhỏ hơn và bằng (n-1)/n nhân với giá trị chuẩn. Sự khác biệt này có thể bỏ qua cho n lớn hơn hoặc bằng 20, mà điều này cũng cần thiết cho tính hợp lệ của kiểm định chi bình phương.

Bảng 14.5 Tính toán kiểm định χ2 Mantel-Haenszel, ứng dụng cho số liệu ở Bảng 14.4

(a) Kiểm định Nhóm nhỏ a Ea Va

Nam 36 28,7 86 × 64 × 50 × 100/(1502 × 149) = 8,2088 Nữ 24 20,4 30 × 216 × 150 × 100/(2502 × 249) = 7,0786 Tổng số 60 49,1 15,2874 (b) Quy tắc 5 để kiểm tra tính hợp lệ Nhóm nhỏ Tối thiểu của (e,g) g - f Tối đa của (0,g-f) Nam 50 -14 0 Nữ 34 -66 0 Tổng số 84 0

Tính hợp lệ

Kiểm định χ2 Mantel-Haenszel chỉ là xấp xỉ. Ðộ đầy đủ của nó được đánh giá bằng quy tắc số 5 (rule of 5). Ta tính thêm hai giá trị sau cho mỗi bảng và lấy tổng của các bảng

(i) Tối thiểu của (e,g), đó là số nhỏ nhất của e và g

(ii) Tối đại của (0,g-f), bằng không nếu g nhỏ hơn hay bằng f, bằng g- f nếu g lớn hơn.

Cả hai tổng số phải khác giá trị kì vọng, Σ Ea, ít nhất là 5 để cho kiểm định hợp lệ. Chi tiết của các tính toán này cho số liệu leptospira được trình bày ở bảng 14.5(b). Cả hai tổng số 84 và zero khác với 49,1 một số lớn hơn 5, do đó kiểm định χ2 Mantel-Haenszel có giá trị.

Page 82: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

78

Kiểm định chi bình phương định hướng Kiểm định chi bình phương chuản cho bảng 2 × c là một kiểm định tổng quát để đánh giá có sự khác nhau trong c tỉ lệ haykhông. Khi các phạm trù trong một cột có các thứ tự tự nhiên thì một kiểm định hợp lí sẽ là tìm xem có định hướng tăng hay giảm của những tỉ lệ theo cột hay không. Thí dụ được đưa ra ở Bảng 14.6, cho thấy số liệu béo phì ở phụ nữ. Có thể thấy rằng tỉ lệ phụ nữ dậy thì sớm có bề dầy lớp mỡ dưới da ở vùng cơ tam đầu tăng. Ðịnh hướng này có thể được kiểmđ ịnh bằng kiểm định chi bình phương định hướng (chi squared test for trend), có một độ tự do.

Bước đầu tiên tiên là gán các điểm (score) cho các cột để mô tả định hướng. Thông thường là chọn số cột 1, 2, 3 v.v. Như ở đây (hay 0, 1, 2, 3 v.v.). Nó đại diện cho định hướng tăng (hay giảm) đều từ cột này sang cột khác và thích hợp trong hầu hết các trường hợp. Một trả năng khác là dùng bề dày lớp mỡ dưới da trung bình trong mỗi nhóm, phản ánh định hướng tuyến tính với các giá trị tuyệt đối của bề dầy lớp mỡ dưới da. (Lưu ý rằng hiệu số giữa kiểm định χ2 chuẩn và χ2 định hướng là giá trị χ2 với (c-2) độ tự do để kiểm định sự sai lệch khỏi định hướng phù hợp (departures from the fitted trend).)

Bước tiếp theo là tính ba giá trị cho mỗi cột và cộng các kết quả.

Bảng 14.6 Quan hệ giữa bề dày lớp mỡ dưới da ở vùng cơ tam đầu và dậy thì sớm. Số liệu từ một nghiên cứu béo phì ở phụ nữ - Beckles et al. (1985), International Journal of Obesity 9, 127-135.

Bề dày lớp mỡ dưới da vùng cơ tam đầu

Tuổi dậy thì Mỏng Trung bình Dày Tổng số <12 tuổi 15(8,8%) 29(12,8%) 36(19,4%) 80 >=12 tuổi 156 197 150 503 Tổng số 171 226 186 583 Ðiểm (score) cho kiểm định định hướng

1 2 3

(i) rx, tích số của r, ô trong hàng đầu tiên của cột và điểm x

(ii) nx, tích số của tổng số, n, của cột và điểm x

(iii) nx2, tích số của tổng số, n, của cột và bình phương của điểm, x2

Dùng N để kí hiệu tổng số chung và R là tổng hàng đầu tiên, công thức tính kiểm định chi bình phương định hướng (có hiệu chỉnh tính liên tục) như sau:

])()([)1()()()(

1..,)5,0|(|

222

22

nxnxNNN

RNRBnxNRrxA

fdB

A

Σ−Σ−−=Σ−Σ=

=−=

vaì âoïtrong

hæåïng coïχ

Có những dạng kiểm định khác nhau nhưng hầu hết đều tương đương về mặt đại số. Sự khác biệt duy nhất là một số dạng dùng (N-1) thay chỗ cho N trong khi tính toán B. Sự khác biệt này không quan trọng. Kiểm định được chọn ở đây tương đối đơn giản và có thể mở rộng cho một số bảng 2 × c . Trừ 0,5 ở hàng đầu tiên là hiệu chỉnh tính liên tục. Nếu điểm (score) không phải là số cột thì phải loại bỏ chúng.

Việc tính toán cho số liệu ở Bảng 14.6 như sau

Σ (rx) = 15 × 1 + 29 × 2 + 36 × 3 = 181 Σ (nx)= 171 × 1 + 226 × 2 + 186 × 3 = 1181 Σ (nx2)= 171 × 1 + 226 × 4 + 186 × 9 = 2749

Page 83: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

BỔ SUNG MỘT SỐ PHƯƠNG PHÁP CHO BẢNG DỰ TRÙ

79

R = 80; N = 583; N-R = 503

9417,18118158380181 =×−=A

2927,42)11812749583(582583

50380 22 =−××××=B

005,0,1..04,82927,42

)5,09417,18( 22 <==−= Pfdhæåïng coïχ

Do đó định hướng gia tăng tỉ lệ phụ nữ dậy thì sớm với sự gia tăng bề dày lớp mỡ dưới da cơ tam đầu là có ý nghĩa cao (P<0,005)

Mở rộng cho một số bảng 2 × c

Khi số liệu có nhiều nhóm nhỏ mà không thể gộp lại bởi vì biến số gây nhiễu, phải tiến hành cho mỗi nhóm một kiểm định định hướng. Dù vậy có kiểm định tổng kết kết hợp các chứng cứ từ các kiểm định định hướng riêng biệt và có tính đến yếu tố gây nhiễu. Ðó là kiểm định chi bình phương có một độ tự do, bất kể số nhóm nhỏ. A và B được tính cho mỗi bảng như đã mô tả ở trên và được lấy tổng. Giá trị χ2 là:

1..,)5,0|(| 22 =

Σ−Σ= fdB

Ahæåïng coï tàõt Toïm χ

Kĩ thuật phức tạp hơn Hai kĩ thuật phức tạp được nhắc nhở ngắn ở đây bởi vì chúng là những phương pháp mạnh mẽ để phân tích tỉ lệ và bảng dự trù. Phương pháp đầu tiên là hồi quy logistic (logistic regression), phương pháp để phân tích tỉ lệ tương tự như hồi quy bội đối với biến liên tục. Phân tích một số bảng 2 × 2 (hay 2 × c ) được xem là trường hợp đặc biệt của phương pháp này. Thí dụ, số liệu trong bảng 14.4 cho thấy tỉ suất mắc toàn bộ kháng thể leptospira thay đổi theo hai yếu tố giới tính và khu vực. Hồi quy logistic tổng quát hơn phương pháp chi bình phương mô tả ở trên bởi vì chúng cho phép bao gồm các biến liên tục và đánh giá sự tương tác giữa các biến (xem chương 8). Hồi quy logistic được gọi là logistic bởi vì nó nghiên cứu sự phụ thuộc của biến đổi logistic (logistic tranformation) của tỉ lệ theo theo một số biến giải thích. Biến đổi logistic hay logit, được định nghĩa như sau:

=

lãû tè-1lãû tè

eLogit log

Mô hình được cân chỉnh bằng kĩ thuật toán học gọi là độ khả dĩ cực đại (maximum likelihood) và cũng tính đến yếu tố là sự biến thiên của tỉ lệ có phân phối nhị thức

Kĩ thuật thứ hai tương tự là sử dụng mô hình tuyến tính log (log linear model). Cả hai phương pháp này có thể được tiến hành bằng cách sử dụng phần mềm GLIM (1978), mà trên của nó là các chữ đầu của mô hình tương tác tuyến tính tổng quát hóa (Generalized Linear Interactive Modelling). Một loạt các mô hình khác nhau được cân chỉnh giống như trong hồi quy bội. Ý nghĩa của một biến được đánh giá bằng cách chân chỉnh hai mô hình: một có biến số đó và một không. Kiểm định dựa trên sự khác biệt deviance (giống như tổng bình phương phần dư, xem Chương 10) của hai mô hình. Sự khác biệt này có phân phối χ2 với số độ tự do bằng số tham số thêm vào. Xem thêm chi tiết ở Anderson et al. (1980) hay xem cách tiếp cận toán học ở Dobson (1984).

Có thể tìm thấy phần trình bày hồi quy logistic ở trong sách của Breslow và Day (1980) và Schlesselman (1982). Mặc dù chúng là được viết trong bối cảnh một nghiên cứu bệnh chứng (xem chương 24), phương pháp có thể áp dụng cho phân tích tỉ lệ. Những cuốn sách này cũng

Page 84: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

80

trình bày hồi quy logistic có điều kiện (conditioned logistic regression). Ðây là loại hồi quy logisitic thích hợp cho phân tích số liệu bắt cặp (matched data), có thể xem như là mở rộng của kiểm định cặp đôi χ2 McNemar.

Page 85: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

ÐO LƯỜNG BỆNH TẬT VÀ TỬ VONG

81

ÐO LƯỜNG BỆNH TẬT VÀ TỬ VONG

Giới thiệu Ở chương này chúng ta quan tâm đến việc đo lường tử vong và bệnh tật và đặc biệt xem xét đến việc sử dụng tỉ suất (rate). Tỉ suất tử vong hay bệnh tật là số người chết hay mắc bệnh trong một khoảng thời gian nhất định chia cho tổng số người được quan sát để tìm biến cố đó. Trước tiên sẽ trình bày những tỉ suất thường dùng. Sau đó sẽ xem xét các vấn đề về tính toán và so sánh các tỉ suất trong các dân số nghiên cứu có cấu trúc tuổi giới tính khác nhau và mô tả các kĩ thuật thống kê để chuẩn hóa tỉ suất. Cuối cùng sẽ tổng kết ngắn gọn phương pháp phân tích

Tỉ suất sinh và chết Tỉ suất sinh và chết của dân số được dựa trên các số thống kê thu thập được trong một năm lịch. Ðể tiện lợi các tỉ suất này thường được nhân cho 1000 để tránh các số lẻ và được trình bày chẳng hạn như số sinh cho mỗi 1000 thành viên dân số hàng năm. Các đo lường phổ biến là:

1000×=nàm giæîa säú dánnàmtrong sinh Säú sinh suáút Tè 1.

1000×=nàm giæîa åí 44-15 tæì næî phuû säú dán

nàmtrong säúng sinh Säú âeí màõn suáút Tè 2.

1000×=nàm giæîa säú dánnàmtrong chãút Säú thävong tæí suáút Tè 3.

1000×=âoï (giåïi) tuäøi nhoïm cuía nàm giæîa säú dán(giåïi) tuäøi nhoïm mäüttrong nàmtrong chãút Säú

(giåïi) tuäøi theo hiãûu âàûcvong tæí suáút Tè 4.

1000×=nàmtrong säúng sinh säú

nàmtrong ra xaíy tuäøi 1 dæåïi treí åí chãút Säú em treívong tæí suáút Tè 5.

1000×=nàmtrong säúng sinh säú

nàmtrong ra xaíy tuäøingaìy 28 dæåïi treí åí chãút Säú sinh såvong tæí suáút Tè 6.

1000×+

+=nàmtrong saín) tæísäúng ( sinh säú

nàmtrong tuäøingaìy 7 dæåïi chãút saín tæí chãút Säúsinh chu

vong tæí suáút Tè 7.

1000×= nàm giæîa säú dán

nàmtrong biãûtâàûc nhán nguyãn mäüt do chãút Säú nhán nguyãn hiãûu âàûc

vong tæí suáút Tè 8.

1000×= nàmtrong chãút säútäøng

nàmtrong biãûtâàûc nhán nguyãn mäüt do chãút Säú lãû tè

vong tæí suáút Tè 9.

1000×=âoï bãûnhcuía ca säútäøng

biãûtâàûc nhán nguyãn mäüt do chãút Säúvong tæí - bãûnhsuáút tè 10.

Lưu ý rằng mặc dù những số này được gọi là tỉ suất, trên thực tế chúng thuộc hai loại khác nhau. Những số được đánh dấu sao (*), số 1, 2, 3, 4, 8, là những số thực sự là tỉ suất theo nghĩa toán học đo lường các thuộc tính trong dân số thay đổi theo thời gian nhanh chậm thế nào. Do đó tỉ suất sinh đo lường kích thước dân số được tăng do số sinh mới nhanh như thế

Page 86: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

82

nào và tỉ suất tử vong thô đo lường sự giảm dân số do tử vong nhanh như thế nào. Các số khá, được đánh dấu thập (�), số 5, 6, 7, 9, 10, là những số đúng hơn nên gọi là nguy cơ (risk) bởi vì chúng là xác suất xuất hiện một biến cố nhất định. Do đó, tỉ suất ác tính đo lường nguy cơ một người vì một bệnh nào đó khi mắc bệnh đó. Mặc dù sự phân biệt giữa nguy cơ và tỷ suất đã được mô tả rõ ràng bởi William Farr trong đầu thế kỉ19, chỉ gần đây nó mới được chú ý trở lại (Vandenbrouke 1985) và các thuật ngữ hiện đại vẫn còn lẫn lộn. Sự khác biệt sẽ được thảo luận thêm trong chương về số đo mới mắc bệnh.

Lưu ý rằng người ta dùng một số phương pháp tính toán gián tiếp để đo lường nguy cơ. Thí dụ, tỉ suất tử vong trẻ em là nguy cơ đứa trẻ chết trước kì sinh nhật đầu tiên của nó. Phương pháp trực tiếp để đo lường là theo dõi một đoàn hệ các trẻ mới sinh và ghi nhận tỉ lệ trẻ trong đoàn hệ chết trước khi kì sinh nhật thứ nhát của nó. Dù vậy, để tiện lợi, tỉ suất tử vong trẻ em được ước tính bằng tỷ số chết dưới một năm tuổi và số sinh sống trong một năm. Do đó tử số sẽ gồm một số chết trong những đứa trẻ được sinh trong năm trước và như thế cũng bỏ qua một số tử vong trong số trẻ đã sinh trong năm mà không được theo dõi tới năm sau. Trong một dân số ổn định người ta giả sử rằng hai yếu tố này sẽ triệt tiêu lẫn nhau. Một quan điểm tương tự sẽ được áp dụng để ước tính tỉ suất tử vong sơ sinh và tỉ suất tử vong chu sinh.

Ðo lường tử vong trong một nghiên cứu Ðịnh nghĩa tỉ suất tử vong được trình bày ở trên dựa trên số chết xảy ra trong một năm lịch chia cho dân số giữa năm. Dù vậy trong một nghiên cứu, không những tử vong được ghi nhận trong một giai đoạn bất kì (chứ không phải một năm) mà các cá nhân còn có thể được theo dõi trong những khoảng thời gian khác nhau do những lí do khác nhau. Những lí do này bao gồm sự chiêu mộ dần dần các đối tượng nghiên cứu để trải đều công việc theo thời gian, sự chiêu mộ các trẻ mới sinh hay các case bệnh mới khi chúng xuất hiện, sự chiêu mộ các người dân mới nhập cư vào khu vực và không theo dõi được do họ di cư khỏi khu vực, không còn muốn tham gia hay chết. Do đó, số tử vong quan sát được liên quan với số người năm quan sát (person-years of observation), chứ không phải với dân số giữa năm. Lưu ý rằng một người năm quan sát có thể là một người được quan sát trong trọn một năm hay 12 người được quan sát trong một tháng

1000×=saït quan nàm -ngæåìi

nàmtrong chãút Säú thävong tæí suáút Tè

Tỉ suất tử vong thường được nhân với 1000 và kết quả được tính theo 100 người năm theo dõi. Khi báo cáo tỉ suất cần phân biệt rõ giữa môi 1000 người mỗi năm , có nghĩa là theo dõi trong cùng một khoảng thời gian và mỗi 1000 người-năm.

Xét một tình huống phổ biến khi tử vong được ghi nhận bằng cuộc điều tra cộng đồng hai lần và đếm số người chết trong khoảng giữa. Một người có mặt ở cả hai cuộc điều tra sẽ tham gia tổng số người năm quan sát. Một người chết hay di chuyển trong giai đoạn đó tham gia một số năm bằng số năm giữa lần khám thứ nhất và ngày chết hay ngày rời khỏi, trong khi đó một người sinh ra hay di chuyển vào cộng đồng giữa hai cuộc điều tra góp vào một số năm bằng số năm giữa ngày sinh hay ngày gia nhập cộng đồng và cuộc điều tra thứ hai. Nếu không thể xác định chính xác ngày chết hay ngày rời khỏi, người ta thường giả sử rằng sự kiện đó xảy ra ở giữa hai cuộc điều tra.

Ðo lường tử vong Có hai phương pháp chính để đo lường sự mắc bệnh của cộng đồng. Số mới mắc (incidence) là số các trường hợp bệnh mới trong một giai đoạn thời gian nhất định so với số người có nguy cơ (persons at risk) mắc bệnh đó; trong khi mắc toàn bộ (prevalence) dựa trên tổng số các trường hợp bệnh hiện có trong toàn dân số. Ðộ lớn của mắc toàn bộ phụ thuộc vào độ lớn

Page 87: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

ÐO LƯỜNG BỆNH TẬT VÀ TỬ VONG

83

của mắc toàn bộ và khoảng thời gian mắc bệnh; đối với mới mắc cố định, mắc toàn bộ sẽ lớn hơn đối với bệnh kéo dài trong nhiều năm so với bệnh chỉ kéo dài trong vài ngày.

Số mắc toàn bộ

Số mắc toàn bộ có thể đo lường ở một thời điểm (mắc toàn bộ thời điểm - point prevalence) hay trong một khoảng thời gian (số mắc toàn bộ thời khoảng - period prevalence). Nó thường được tính theo phần trăm hay nếu nhỏ theo phần ngàn của dân số

khoaíng thåìi giæîa åí säú dán bäütoaìntræåïc chokhoaíng thåìitrong

âoï naìo gian thåìi mäüt åí bãûnhcoï ngæåìi Säú

khoaíng) (thåìi màõc hiãûn suáút Tè 2.

säú dán bäütoaìnâiãøm thåìi mäüt taûi

bãûnhcoï ngæåìi Säú

âiãøm) (thåìi màõc hiãûn suáút Tè 1.

=

=

Số mắc toàn bộ thời điểm phổ biến hơn và hữu ích hơn và thường được gọi đơn giản là mắc toàn bộ

Số mới mắc

Có hai cách khác nhau để định nghĩa mới mắc; nó có thể được đo lường như một nguy cơ hay như một tỉ suất. Nguy cơ mới mắc (incidence risk) là xác suất một người lúc đầu không mắc bệnh sau đó có bệnh ở một thời gian nào đó trong khoảng thời gian quan sát. Nó thường được tính bằng phần trăm và nếu nhỏ bằng phần ngàn người. Mặt khác tỉ suất mới mắc (incidence rate) là tốc độ mắc bệnh trong số những người vẫn còn nguy cơ (khi một người mắc bệnh họ không còn nguy cơ). Số case mới không phụ thuộc vào số người nguy cơ lúc đầu mà với số người nguy cơ trung bình trong thời kì đó, nhân với chiều dài của thời kì, tương đương với số người năm nguy cơ (person-years at risk) trong thời kì. Ðối với bệnh phổ biến, như là tiêu chảy, có thể tấn công nhiều lần, tỉ suất mới mắc đo lường số lần mắc cho mỗi người cho mỗi năm.

gian) thåìikhoaíng trung bçnh cå(nguy khoaíng thåìi suäúttrong cånguy nàm ngæåìi säúâënh nháút gian thåìikhoaíng mäüttrong

måïi bãûnhhåüptræåìng Säú

màõc måïi suáút Tè 2.

säú dán bäütoaìnâënh nháút gian thåìikhoaíng mäüttrong

måïi bãûnhhåüptræåìng Säú

màõc måïi cåNguy 1.

×

=

=

Người năm nguy cơ được tính tương tự như cách tính người năm quan sát. Sự khác biệt duy nhất là đối với bệnh có thể xảy ra nhiều lần, một người tham gia vào tổng số thời gian không mắc bệnh trong nghiên cứu, chứ không phải chỉ thời gian từ lúc bắt đầu nghiên cứu tới lần mắc bệnh đầu tiên

Ðối với bệnh hiếm như ung thư, hai mới mắc này giống nhau về cơ bản, bởi vì số người nguy cơ sẽ gần bằng với tổng dân số ở mọi lúc. Vì lí do này, chúng thường không phân biệt rõ ràng. Dù vậy, đối với bệnh phổ biến nguy cơ và tỉ suất mới mắc khác nhau.

Thí dụ, xét bệnh sởi trong năm tuổi thứ hai ở một nước mà ít có tiêm chủng sởi. Giả sử rằng theo dõi 1000 trẻ trước đây chưa bị nhiễm sởi từ sau sinh nhật lần thứ nhất của nó trong vòng một năm và có 140 trẻ bị sởi và 860 trẻ vẫn còn có nguy cơ ở cuối năm. Nguy cơ mới mắc là

Page 88: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

84

xác suất trẻ không mắc bệnh sởi trong năm đầu tiên mắc bệnh trong năm thứ hai và bằng 140/1000 = 0,1400 hay 14,0%. Mặt khác tỉ suất nguy cơ là tỉ suất (tốc độ) mắc bệnh sởi trong năm thứ hai. Nếu chúng ta giả sử rằng số trường hợp mắc sởi trải đều trong năm, số nguy cơ trung bình sẽ bằng trung bình cộng ở lúc đầu năm và cuối năm bằng (1000 + 860)/2 = 930. Tỉ suất nguy cơ bằng 140/930 = 0,1505 hay 150,5 trên 1000 trẻ-năm nguy cơ (child-years at risk)

Nguy cơ tương đối

Ðôi khi người ta tóm tắt sự so sánh hai mới mắc bằng tỉ số của chúng chứ không phải bằng hiệu số của chúng. Thí dụ, con người hút thuốc lá có nguy cơ mắc suyễn gấp 3 lần con những người không hút. Tỉ số này được gọi là nguy cơ tương đối (relative risk) và được nói rõ trong chương 24.

Tỉ suất chuẩn hóa Bởi vì cả nguy cơ chết và nguy cơ mắc bệnh liên quan đến tuổi, và bởi vì chúng khác nhau tùy theo giới tính, tỉ suất tử vong thô và tỉ suất mới mắc và mắc toàn bộ chung phụ thuộc vào cấu trúc tuổi giới tính của dân số. Thí dụ, một dân số tương đối già sẽ có tỉ suất tử vong thô cao hơn dân số trẻ, ngay cả khi tử vong là như nhau. Do đó sẽ sai lầm nếu dùng tỉ suất chung khi so sánh hai dân số khác nhau trừ khi chúng có cùng một cấu trúc tuổi giới tính. Thay vì vậy cần dựa trên tỉ suất đặc hiệu tuổi giới tính và kiểm định chung sự khác biệt bằng kiểm định χ2 Mantel-Haenszel áp dụng cho từng nhóm tuổi giới tính (xem Chương 14).

Dù vậy cũng cần có tỉ suất chung tổng kết đã điều chỉnh cho sự khác biệt tuổi giới tính. Có thể đạt được điều này nhờ việc sử dụng một dân số chuẩn (standard population) với phương pháp chuẩn hóa (standardization) trực tiếp hay gián tiếp. Trong phương pháp chuẩn hóa trực tiếp (direct method), tỉ suất đặc hiệu tuổi giới tính từ mỗi dân số nghiên cứu đươc áp dụng cho một dân số chuản để có tỉ suất tử vong được điều chỉnh theo tuổi giới tính (age-sex adjusted mortality rate), trong phương pháp gián tiếp (indirect method) tỉ suất đặc hiệu tuổi giới tính của dân số chuẩn được áp dụng cho mỗi dân số quan tâm để có tỉ số tử vong chuẩn hóa (standardized mortality ratio). Tỉ số này có thể dùng để tính tỉ suất điều chỉnh. So sánh được trình bày trong bảng 15.1 cho thấy hai phương pháp đòi hỏi những số liệu khác nhau.

Việc chọn lựa phương pháp phụ thuộc vào số liệu có sẵn và sự chính xác của chúng. Thí dụ, trong khi so sánh tỉ suất tử vong của các quốc gia khác nhau, phương pháp gián tiếp hay hơn bởơi vì rất khó có được số liệu quốc gia về tỉ suất tử vong đặc hiệu tuổi giới tính. Nói chung, chuẩn hóa gián tiếp thường được dùng phổ biến cho tử vong là số mới mắc trong khi chuẩn hóa gián tiếp dùng cho mắc toàn bộ.

Cả hai phương pháp có thể được mở rộng để điều chỉnh các yếu tố khác ngoài tuổi và giới tính, như cấu trúc chủng tộc trong các nhóm nghiên cứu. Phương pháp trực tiếp có thể dùng

Bảng 15.1 So sánh phương pháp chuẩn hóa trực tiếp và gián tiếp

Chuẩn hóa trực tiếp Chuẩn hóa gián tiếp Số liệu cần thiết Dân số nghiên cứu tỉ suất đặc hiệu tuổi giới tính cấu trúc dân số + tỉ suất chung Dân số chuẩn cấu trúc dân số tỉ suất đặc hiệu tuổi giới tính + tỉ suất

chung Phương pháp tỉ suất nghiên cứu đươc áp dụng vào

dân số chuẩn tỉ suất chuẩn được áp dụng vào dân

số nghiên cứu Kết quả tỉ suất điều chỉnh tuổi giới tính tỉ suất tử vong chuẩn hóa (+ tỉ suất

điều chỉnh giới tính)

Page 89: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

ÐO LƯỜNG BỆNH TẬT VÀ TỬ VONG

85

để tính trung bình chuẩn hóa (standardized mean) như huyết áp trung bình được điều chỉnh theo tuổi giới tính cho các nhóm nghề nghiệp khác nhau.

Chuẩn hóa trực tiếp

Bảng 15.2 trình bày tỉ suất mắc toàn bộ đặc hiệu và tỉ suất mắc toàn bộ chung thô của bệnh nhiễm onchocerca trong hai làng A và B. Lưu ý rằng tỉ suất mắc toàn bộ của onchocerca gia tăng theo tuổi và cao ở nam hơn ở nữ và cấu trúc tuổi giới tính của các mẫu từ 2 làng khác nhau. Tỉ suất mắc toàn bộ chung phải được điều chỉnh theo tuổi giới tính trước khi chúng được so sánh. Ðiều này có thể tiến hành bằng phương pháp chuẩn hóa trực tiếp.

Trước tiên, cần phải xác định dân số chuẩn. Thường theo một trong các cách sau: hoặc là một dân số nghiên cứu, hay tổng số hai dân số nghiên cứu (ở dưới sẽ làm theo cách này) và dân số điều tra từ địa phương hay quốc gia. Việc chọn lựa này có phần nào tùy tiện. Dù vậy cần lưu ý rằng mặc dù những lựa chọn khác nhau sẽ cho các tỉ suất tổng kết khác nhau nhưng điều này ít ảnh hưởng đến việc lí giải kết quả.

Thứ nhì, sẽ tính toán số người trong dân số chuẩn hóa bị nhiễm bệnh nếu tỉ suất mắc toàn bộ đặc hiệu tuổi giới tính sẽ giống như trong làng A. Thí dụ, xét phái nam tuổi từ 0-4 tuổi. Hai trong 36 người trong nhóm tuổi này bị nhiễm bệnh ở làng A vì vậy tỉ suất mắc toàn bộ là 5,6%. Có 50 phái nam thuộc lứa tuổi này trong dân số chuẩn và nếu tỉ suất mắc toàn bộ cũng là 5,6% thì có nghĩa là 5,6% × 50 = 2,8 người trong số đó bị nhiễm bệnh. Các số khác trong các nhóm tuổi giới tính khác được trình bày trong Bảng 15.2. Nói chung sẽ có 142,9 trong 445 người bị nhiễm onchocerca trong dân số chuẩn, tính ra tỉ suất mắc toàn bộ chung là 32,1% (142,9/445 × 100). Số này được gọi là tỉ suất mắc toàn bộ điều chỉnh tuổi giới tính của làng A.

Bảng 15.2 Sử dụng chuẩn hóa trực tiếp để so sánh tỉ suất mắc toàn bộ của onchocerca trong hai làng A và B. Dân số chung của hai làng được dùng làm dân số chuẩn.

Làng A

Làng B Dân số chuẩn

(làng A + B)

Tuổi Số được khám

số bị nhiễm

% nhiễm

Số được khám

số bị nhiễm

% nhiễm

Số được khám

LàngA

Làng B

Nam 0-4 36 2 5,6 14 1 7,1 50 2,8 3,6 5-9 42 4 9,5 28 4 14,3 70 6,7 10,0 10-14 12 3 25,0 10 9 90,0 22 5,5 19,8 15-29 6 4 66,7 11 11 10,0 16 10,7 16,0 30-49 11 9 81,8 11 11 100,0 22 18,0 22,0 50+ 21 17 81,0 8 8 100,0 29 23,5 29,0 Nữ 0-4 35 1 2,9 17 1 5,9 52 1,5 3,1 5-9 52 4 7,7 15 2 13,3 67 5,2 8,9 10-14 15 3 20,0 9 4 44,4 24 4,8 10,7 15-29 24 14 58,3 12 11 91,7 36 21,0 33,0 30-49 25 19 76,0 17 17 100,0 42 31,9 42,0 50+ 8 6 75,0 7 7 100,0 15 11,3 15,0 Tổng số

287 86 30,0 158 85 53,8 445 142,9 213,1

Tỉ suất mắc toàn bộ điều chỉnh tuổi giới tính

32,1 47,9

Page 90: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

86

tám quan säú dán cuía hiãûu âàûc màõc hiãûn suáút tè nhæ tætæång

ûgiåïi tuäøi hiãûu âàûc màõc hiãûn suáút tè nãúuchuáøn säú dántrong màõc hiãûn suáút tè bäüToaìn

giåïi-tuäøi theo chènh âiãöu màõc hiãûn suáút Tè =

Tỉ suất mắc toàn bộ điều chỉnh theo tuổi-giới tính cho làng B cũng được tính tương tự. Nó bằng 47,9% cao hơn đáng kể so với làng A. Kiểm định χ2 Mantel-Haenszel so sánh tỉ suất mắc toàn bộ giữa hai làng này có ý nghĩa (χ2=21,7; d.f.=1; P<0,001).

Chuẩn hóa gián tiếp

Bảng 15.3 trình bày kết quả của một cuộc nghiên cứu lớn trong một vùng lưu hành onchocerca, trong đó có 12816 người từ trên 30 tuổi được theo dõi trong 1 năm. Một điểm cần quan tâm là đánh giá xem có phải mù lòa, hậu quả của nhiễm onchocerca, dẫn đêm nguy cơ tử vong gia tăng hay không. Ðiều quan trọng là xem xét các tỉ suất tử vong tuổi giới tính riêng bởi vì tử vong gia tăng theo tuổi và khác nhu giữa giới tính mà còn bởi vì mắc toàn bộ của mù lòa gia tăng theo tuổi và cao ở nam hơn ở nữ. Dân số bị mù do đó dẽ già hơn và có tỉ lệ nam cao hơn và như vậy tỉ suất chết thô sẽ cao hơn so với dân số không mù ngay cả khi tỉ suất đặc hiệu tuổi giới tính giống nhau. So sánh chung giữa người mù và không mù phải dùng phương pháp chuẩn hóa gián tiếp.

Giống như trong chuẩn hóa trực tiếp, bước đầu tiên là xác định dân số chuẩn. Việc lựa chọn cũng giống như trên nhưng có hạn chế là cần tỉ suất tử vong đặc hiệu tuổi giới tính cho dân số chuẩn và do đó dân số được chọn cho mục đích này phải đủ lớn để có ước lượng tin cậy của những tỉ suất này.

Những tỉ suất chuẩn sau đó được áp dụng cho dân số quan tâm để tính số tử vong kì vọng trong dân số nếu tử vong giống như trong dân số chuẩn. Thí dụ, người ta kì vọng tỉ lệ 19/2400 của 120 người mù tuổi từ 30 đến 39 sẽ bị chết nếu nguy cơ chết giống như những người đàn ông không mù cùng tuổi. Tính chung, có 22,55 tử vong kì vong trong dân số nười mù so với số quan sát là 69. Tk số giữa số tử vong quan sát và số tử vong kì vọng được gọi là tỉ số tử vong chuẩn hóa (standardize mortality ratio - SMR). Trong trường hợp này nó bằng 3,1 (69/22,55).

chuáøn säú dántrong nhæ tæûtæång giåïi tuäøi hiãûu âàûc suáút tè nãúuvoüng kç chãút Säú

âæåüc saït quan chãút säú (SMR)

hoïa chuáønvong tæí säú Tè =

SMR đánh giá một người trong dân số nghiên cứu so với một người trong dân số chuẩn dễ chết hơn (hay ít hơn) mấy lần. Giá trị bằng 1 có nghĩa là khả năng chết bằng nhau, giá trị lớn hơn một có nghĩa là dễ chết hơn, nhỏ hơn một nghĩa là khó chết hơn. SMR đôi khi được nhân cho 100 và tính bằng phần trăm.

Bởi vì dân số không bị mù được dùng làm chuẩn, số kì vọng và số quan sát của nó bằng nhau do đó SMR = 1. So sánh hai SMR cho thấy nhìn chung, người mù dễ bị chết gấp 3,1 lần so với người không bị mù trong khoảng thời gian một năm. Kiểm định χ2 Mantel-Hanenzel có ý nghĩa cao (χ2=55,7, độ tự do = 1, P <0,001).

Page 91: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

ÐO LƯỜNG BỆNH TẬT VÀ TỬ VONG

87

Tỉ suất tử vong được điều chỉnh theo tuổi giới tính có thể tính được bằng cách nhân SMR cho tỉ suất tử vong thô của dân số chuẩn. Tính ra được tỉ suất tử vong điều chỉnh tuổi giới tính là 12,8 và 39,7/1000/năm cho dân số không bị mù và dân số bị mù

chuáøn. säú dánthävong tæí suáút tè

tênh giåïi tuäøi chènh âiãöuvong tæí suáút Tè ×= SMR

Phân tích tỉ suất Phương pháp được mô tả ở Chương 12, 13 và 14 liên quan đến tỉ lệ được áp dụng cho phân tích tỉ suất mắc toàn bộ, tử vong và mới mắc nguy cơ bởi vì chúng là các tỉ lệ. Những phương pháp này có thể được áp dụng cho phân tích những tử vong và mới mắc nguy cơ, khi số trường hợp tử vong (hay trường hợp bệnh mới) nhỏ so với số người nguy cơ trung bình, bởi vì trong trường hợp này tỉ suất thường được xem như là tỉ lệ. Một cách khác tỉ suất tử vong và mới mắc có thể được phân tích nhờ phân phối Poisson, được mô tả ở Chương 17 và mô hình tuyến tính log được nhắc đến ở Chương 14, với điều kiện mỗi trường hợp xảy ra độc lập với nhau và ngẫu nhiên về thời gian.

Bảng 15.3 Sử dụng chuẩn hóa gián tiếp để so sánh tỉ suất tử von giữa người mù và người không mù, được thu thấp trong một cuộc nghiên cứu một năm trong vùng lưu hành onchocerca. Tỉ suất tử vong của dân số không bị mù được dùng làm tỉ suất chuẩn

dân số

không mù dân số

mù Số chết kì

vọng trong dân số

người mù nếu tỉ suất

Tuổi Số theo dõi

Số chết Chết/1000/năm

Số theo dõi

phần trăm bị mù

Số chết Chết/1000/nàm

giống như trong dân số không

bị mù Nam 30-39 2400 19 7,9 120 4,8 3 25,0 0,95 40-49 1590 21 13,2 171 9,7 7 40,9 2,26 50-59 1120 20 17,9 244 17,9 13 53,3 4,36 60+ 610 20 32,8 237 28,0 24 101,3 7,77 Nữ 30-39 3100 23 7,4 84 2,6 2 23,8 0,62 40-49 1610 22 13,7 69 4,1 3 43,5 0,94 50-59 930 16 17,2 198 15,3 8 47,6 2,89 60+ 270 8 29,6 93 25,6 9 96,8 2,76 Tổng số 11630 149 12,8 1196 9,3 69 58,2 22,55 SMR 1,0 3,1(69/22,5) Tỉ suất tử vong điều chỉnh tuổi giới tính

12,8 39,7(3,1× 12,8)

Page 92: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

88

PHÂN TÍCH SỐNG CÒN

Giới thiệu Trong Chương 15 chúng ta đã xem xét cách tính và phân tích tỉ lệ tử vong. Trong chương này chúng ta sẽ mô tả các phương pháp phân tích sống còn, chú trong không chỉ vào sự kiện người đó có chết hay không mà còn vào thời gian sống còn (survival time) trước khi chết. Phương pháp phân tích sống còn có thể được áp dụng cho các biến cố như nghiên cứu thời gian bú sữa trong đó sự kiện kết thúc có thể là việc cai sữa.

Bảng sống Mô thức sống còn của cộng đồng thường được mô tả trong bảng sống (life table). Bảng sống có 2 dạng. Dạng thứ nhất, bảng sống đoàn hệ (cohort life table). Trình bày thời gian sống còn của một nhóm cá nhân thực sự theo thời gian. Ðiểm khởi phát để đo thời gian sống còn có thể là lúc sinh hay có thể là biến cố khác. Thí dụ, một bảng sống đoàn hệ có thể dùng thể trình bày tử vong của một nhóm nghề nghiệp tùy theo khoảng thời gian trong nghề, hay mô thức sống còn của bệnh nhân sau điều trị, thí dụ như sau khi điều trị, như xạ trị ung thư phế quản tế bào nhỏ (Bảng 16.1). Loại bảng sống thứ nhì, bảng sống hiện hành (current life table) thương được dùng trong mục đích bảo hiểm và ít phổ biến trong nghiên cứu y khoa. Bảng này trình bày thời gian sống còn kì vọng theo thời gian của một dân số giả thuyết được áp dụng tỉ suất tử vong đặc hiệu tuổi giới tính hiện nay.

Việc xây dựng bảng sống được mô tả nhờ xem xét bảng 16.1, trình bày thời gian sống còn bệnh nhân bị ung thư phế quản tế bào nhỏ, từng tháng một sau khi xạ trị. Bảng này dựa trên số liệu thu thập trong giai đoạn 5 năm. Số liệu được tóm tắt trong cột 1-4 của bảng sống, và các giá trị tính toán ở trong cột 5-8.

Cột 1 trình bày số tháng từ khi bắt đầu xạ trị. Cột 2 và 3 gồm số bệnh nhân còn sống ở đầu tháng và số người chết trong tháng. Thí dụ, 12 trong 240 bệnh nhân chết trong tháng thứ nhất sau khi điều trị, còn lại 228 người còn sống ở đầu tháng thứ hai.

Trong nghiên cứu loại này rất hiếm khi có thể theo dõi tất cả các bệnh nhân cho đến khi họ chết. Thứ nhất là do một số bệnh nhân có thể đi ra khỏi vùng nghiên cứu hay quyết định không còn tham gia. Ðiều này là một vấn đề quan trọng đối với một nghiên cứu theo dõi kéo dài. Thứ nhì bởi vì bệnh nhân thườn tham gia dần dần vào nghiên cứu, những người tham gia ở cuối thời gian nghiên cứu sẽ chỉ được theo dõi trong thời gian ngắn. Vì vậy trừ khi họ chết sớm, họ cũng thường không được theo dõi đủ. Do đó có những bệnh nhân sống tới một thời điểm nào đó nhưng tình trạng sống còn sau đó không rõ. Thời gian sống còn của họ gọi là được kiểm duyệt (censored). Những bệnh nhân đó được trình bày trong cột 4. Tổng số người nguy cơ bị chết trong tháng, sau khi đã được điều chỉnh cho sự thất lạc, được trình bày ở cột 5. Nó bằng với số bệnh nhân sống ở đầu tháng, trừ cho phân nửa số bị thất lạc, giả thiết rằng trung bình những sự thất lạc này xảy ra ở giữa tháng.

Page 93: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

PHÂN TÍCH SỐNG CÒN

89

Cột 6 trình bày nguy cơ tử vong trong tháng, được tính bằng số chết trong tháng chia cho số người nguy cơ. Cột 7 là cơ hội sống còn trong tháng, cột 8 là cơ hội sống còn chung (overall) hay tích lũy (cumulative), bằng cơ hội sống còn tính tới cuối tháng trước nhân với cơ hội sống còn trong tháng. Thí dụ, nguy cơ tử vong trong tháng thứ nhất là 12/240 hay 0,0500. Cơ hội sống còn do đó bằng 1 trừ 0,05 bằng 0,95. Trong tháng thứ hai 9 trong số 228 người còn lại bị chết tính ra nguy cơ tử vong là 0,0395 và cơ hội sống còn là 0,9605. Ðiều này có nghĩa là bệnh nhân đã sống tới tháng thứ nhất (với xác suất 0,9500) thì có cơ hội sống còn trong tháng thứ hai là 0,9605. Cơ hội sống còn chung hai tháng sau khi bắt đầu trị liệu là 0,9500 × 0,9605 = 0,9125.

Ðường cong sống còn

Trong nghiên cứu này tất cả những bệnh nhân chết sau 18 tháng. Ðường cong sống còn vẽ từ các giá trị trong cột 8 được vẽ trong Hình 6.1.

Kì vọng sống

Thời gian sống còn trung bình hay kì vọng sống (life expectancy) cũng đáng được quan tâm. Có thể tính bằng cách dùng cột 1 và 8 của bảng sống. Trong mỗi thời khoảng, thời gian sống được nhân với cơ hội sống còn lũy tích. Tổng các giá trị này cộng thêm 1/2 là kì vọng sống. (cộng vào 1/2 là do tác động của việc phân nhóm bảng sống theo nguyên tháng và tương tự như hiệu chỉnh tính liên tục mà chúng ta đã gặp trong những chương trước).

×Σ+=

têchluîy coìnsäúng häüi cå

khoaíng thåìi mäùi trongthaïng Säú

21säúng voüng Kç

Trong bảng 16.1 tất cả các khoảng là một tháng và do đó kì vọng sống là tổng các giá trị trong cột 8 cộng với 1/2 bằng 7,95 tháng.

Bảng 16.1 Bảng sống trình bày kiểu hình sống còn của 240 bệnh nhân bị ung thư phế quản tế bào nhỏ được xạ trị

(1) Thời khoảng từ khi bắt đầu điều trị

(2) Số còn sống ở đầu

thời khoảng

(3) Số chết trong thời

khoảng

(4) Số không theo dõi được trong thời

khoảng

(5) Số người nguy cơ = (2) -

(4)/2

(6) nguy cơ chết trong

thời khoảng

(7) Cơ hội sống còn trong thời

khoảng

(8) Cơ hội sống còn

lũy tích từ đầu trị liệu

= (8, 1 240 12 0 240,0 0,0500 0,9500 0,9500 2 228 9 0 228,0 0,0395 0,9605 0,9125 3 219 17 1 218,5 0,0778 0,9222 0,8415 4 201 36 4 199,0 0,1809 0,8191 0,6893 5 161 6 2 160,0 0,0375 0,9625 0,6634 6 153 18 7 149,5 0,1204 0,8796 0,5835 7 128 13 5 125,5 0,1036 0,8986 0,5231 8 110 11 3 108,5 0,1014 0,8519 0,4700 9 96 14 3 94,5 0,1481 0,8986 0,4004 10 79 13 0 79,0 0,1646 0,8354 0,3345 11 66 15 4 64,0 0,2344 0,7656 0,2561 12 47 6 1 46,5 0,1290 0,8710 0,2231 13 40 6 0 40,0 0,1500 0,8500 0,1896 14 34 4 2 33,0 0,1212 0,8788 0,1666 15 28 5 0 28,0 0,1786 0,8214 0,1369 16 23 7 1 22,5 0,3111 0,6889 0,0943 17 15 12 0 15,0 0,8000 0,2000 0,0189 18 3 3 0 3,0 1,0000 0,0000 0,0000

Page 94: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

90

0,0

0,2

0,4

0,6

0,8

1,0

0 3 6 9 12 15 18

Hình 16.1 Ðường con sống còn cho bệnh nhân bị ung thư phế quản tế bào nhỏ được điều trị bằng xạ trị. Ðường cong được vẽ từ bảng sống, bảng 16.1.

So sánh các bảng sống Bước đầu tiên so sánh hai bảng sống bất kì là vẽ hai đường cong sống còn tương ứng và so sánh chúng bằng mắt. Ý nghĩa thống kê của sự khác biệt quan sát được đánh giá bằng kiểm định log rank. Ðây là một ứng dụng đặc biệt của thao tác χ2 Mantel Haenszel được tiến hành bằng cách xây dựng bảng 2 × 2 cho mỗi khoảng của bảng sống, để so sánh các tỉ lệ chết trong mỗi khoảng. Thí dụ, nếu bảng 16.1 cho thấy đường cong sống còn sau khi xạ trị ung thư phế quản tế bào nhỏ được so sánh với đường cong sống còn sau khi hóa trị, thủ tục này sẽ tạo ra 18 bảng 2 × 2 , mỗi bảng cho một tháng sau khi điều trị. Ứng dụng kiểm định χ2 Mantel Hanszel cho những bảng này sẽ tổng kết sự khác biệt hàng tháng giữa số chết quan sát được sau khi xạ trị và số kì vọng nếu mô thức sống còn sau khi xạ trị giống như sau khi xạ trị. Kiểm định log rank có thể mở rộng để điều chỉnh cơ cấu khác nhau của nhóm điều trị, như tỉ số giới tính khác nhau hay phân phối tuổi khác nhau. thí dụ, giới tính sẽ được tính đến trong thí dụ này bằng cách xây dựng bảng 2 × 2 cho nam và nữ cho mỗi khoảng của bảng sống, và áp dụng kiểm định χ2 Mantel Haenszel cho 36 (2 × 18) bảng. Ðể biết thêm chi tiết, xem bài báo của Peto et al (1976, 1977), hướng dẫn thực hành cho việc phân tích số liệu sống còn.

Một phương pháp khác, tinh vi hơn, để so sánh đường cong sống còn là dùng mô hình nguy cơ tỉ lệ của Cox (Cox's proprotional model), một phương pháp giống như hồi quy bội cho số trung bình và hồi quy logistic cho tỉ lệ. Nó được gọi là mô hình nguy cơ bởi vì nó giả định rằng tỉ lệ của nguy cơ chết trong hai nhóm hằng định theo thời gian, và tỉ lệ này giống nhau cho mỗi nhóm số liệu nhỏ, như các nhóm tuổi- giới tính khác nhau. Xem chi tiết ở Cox và Oakes (1984).

λ

t0

(a) Nguy cơ tử vong = hằng số, λ

Page 95: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

PHÂN TÍCH SỐNG CÒN

91

1

t0

(b) Ðường cong sống còn: tỉ lệ sống còn = e-λt

λ

t0

(c) Phân phối của thời gian sống con = λe-λt thời gian sống trung bình = 1/λ

Hình 16.2 Mô hình mũ: nguy cơ chết theo thời gian (t) hằng định

Mô thức sống còn Xem cột 6 của bảng 16.1 cho thấy rõ nguy cơ tử vong của ung thư tế bào nhỏ gia tăng với thời gian sau khi xạ trị. Người ta đã quan tâm nhiều đến việc tìm kiếm các hàm số toán học mô tả sự liên quan giữa nguy cơ chết (hay còn gọi là tỉ suất nguy hại - hazard rate) theo thời gian. Mô hình đơn giản nhất và nổi tiếng nhất là mô hình mũ (exponential), trong đó nguy cơ chết hằng định theo thời gian. Có thể chứng mình rằng nếu một dân số bị một nguy cơ chết hằng định, không những đường còn sẽ có dạng mũ như hình 16.2 mà phân phối của thời gian sống còn cũng có dạng hình mũ với kì vọng sống bằng nghịch đảo của nguy cơ chết. Mô hình mũ thích hợp khi xem xét đời sống của các tạo vật có đời sống ngắn như muỗi, nguy cơ chết chính không phải vì tuổi tác mà là bởi vì tai nạn trong môi trường. Và nó đã được dùng trong việc xây dựng mộ hình toán học truyền bệnh sốt rét. Các mô hình khác có các hàm số gamma, Weibull, Rayleigh và Gompertz để mô tả nguy cơ chết thay đổi theo thời gian. Mặc dù chúng hữu ích trong việc mô hình hóa bệnh tật và sống còn, những mô hình này không hữu ích trong việc phân tích số liệu sống còn bằng bảng sống và các phương pháp liên quan. Ðể biết chi tiết về các mô hình khác xem Cox và Oakes (1984).

Page 96: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

92

PHÂN PHỐI POISSON

Giới thiệu Chúng ta đã gặp phân phối bình thường cho trung bình và phân phối nhị thức cho tỉ lệ. Trong chương này ta gặp phân phối Poisson, được đặt tên theo tên một nhà toán học Pháp, rất thích hợp cho việc mô tả số lần xuất hiện biến cố theo thời gian, với điều kiện những biến cố này độc lập với nhau và ngẫu nhiên. Một thí dụ là số lần bức xạ tia phóng xạ được phát hiện bởi máy đếm lấp lánh (scintillation counter) trong 5 phút (xem Chương 17.2). Sau khi trình bày tổng quát phân phối Poisson, chúng ta sẽ xét các ứng dụng đặc biệt để phân tích tỉ suất, kể cả tỉ suất mới mắc bệnh.

Phân phối Poisson cũng thích hợp cho các hạt tìm tháy trong một đơn vị không gian, như là số các kí sinh trùng sốt rét trong kính hiển vi của một lam máu, với điều kiện các hạt phân phối ngẫu nhiên và độc lập trên toàn bộ không gian. Muốn đạt được phân phối Poisson cần thỏa hai thuộc tính ngẫu nhiên và độc lập. Thí dụ số trứng Schistosoma mansoni trong mẫu phân trong phải là phân phối Poisson bởi vì trứng có khuynh hướng dích chùm chứ không phải phân phối độc lập.

Ở Chương 18 chúng ta sẽ mô tả cách đánh giá một nhóm số liệu có tuân theo phân phối Poisson hay không và thí dụ 18.2 trình bày số liệu không tuân theo thuộc tính ngẫu nhiên. Hơn nữa, đã có những kĩ thuật để xác định các bệnh có tập trung trong không gian và thời gian hay không (xem tổng quan của Smith, 1982), như là khả năm tập trung các trường hợp bệnh bạch huyết ở trẻ quan các nhà máy năng lượng hạt nhân. Tập trung như vậy vi phạm phân phối Poisson.

Ðịnh nghĩa Phân phối Poisson mô tả phân phối lấy mẫu của số lần xuất hiện, r, của biến cố trong một khoảng thời gian (hay vùng không gian) Nó phụ thuộc chỉ vào một tham số đó là số lần xuất hiện trung bình, m, trong khoảng thời gian bằng nhau (hay trong vùng không gian bằng nhau).

!r

rµµ-ehiãûn) xuáútláön(r suáút Xaïc =

Hầu hết các máy tính cầm tay đều có phím cho 3 hàm số cơ bản của công thức này. Lưu ý rằng, theo định nghĩa, cả 0! và µ0 bằng 1. Do đó xác suất không xuất hiện biến cố là e-µ.

µ=..es

Sai sô úchuẩn cho số lần xuất hiện bằng căn bậc hai của trung bình, được ước lượng bằng căn bậc hai của số lần xuất hiện quan sát, (r.

Thí dụ 17.1

Nhà chức trách y tế tại một quận có kế hoạch đóng cửa một trong hai phòng sinh đánh giá nhu cầu gia tăng đặt ra cho phòng sanh còn lại. Một yếu tố cần xem xét là nguy cơ vào một ngày nào đó nhu cầu nhập viện vượt quá khả năng của phòng. Hiện nay phòng sinh lớn có trung bình 4,2 lần nhập viện trong ngày và có khả năng giải quyết 10 lần nhập viện mỗi ngày. Sau khi đóng của phòng sinh nhỏ số lần nhập viện trung bình sẽ lên khoảng 6,1 lần mỗi ngày. Phân phối Poisson được dùng để ước lượng tỉ lệ số ngày mà khả năng của phòng bị quá tải. Thí dụ ta cần xem xác suất nhập viện hơn hoặc bằng 11 lần mỗi ngày. Ðiều này có thể tính được bằng cách tính xác suất có 0, 1, 2,... tới 10 lần nhập viện và trừ tổng số cho 1, như tính trong bảng 17.1. Thí dụ:

0848,0!31,6 3

==-6,1eviãûn) nháûp láön (3 suáút Xaïc

Page 97: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

PHÂN PHỐI POISSON

93

Tính toán cho thấy xác suất nhập viện 11 lần hay hơn trong một ngày là 0,0470. Do đó khả năng của phòng có thể bị quá tải 4,7% lần hay khoảng 17 ngày trong năm.

Hình dáng Hình 17.1 vẽ hình dáng của phân phối Poisson cho các giá trị trung bình, µ. Phân phối này rất lệch khi trung bình nhỏ, khi đó có xác suất không xẩy ra biến cố rất đáng kể. Nó đối xứng với trung bình lớn và có thể xấp xỉ bằng phân phối bình thường nếu µ ≥ 10.

Kết hợp số đếm Thí dụ 17.2

Một bệnh phẩm được đánh dấu bằng một chất phóng xạ được đếm trong 5 phút trong một buồng đếm lấp lánh đếm được 2905. Sai số chuẩn của số này được ước tính bằng phân phối Poisson

Số hạt đếm được = 2905 s.e. = √2905 = 53,9

Người ta thường trình bày kết quả theo số đếm/phút

Số hạt đếm được trong phút = 2905/5 = 581,0 s.e. = 53,9/5 = 10,8

Khoảng tin cậy trung bình số hạt đếm được trong một phút được tính bằng cách dùng xấp xỉ bình thường:

581 ± 1,96 × 10,8 = 559,8 tới 602,2 hạt/phút

Bảng 17.1 Xác suất số lần nhập viện trong ngày ở một phòng sinh, dựa trên phân phối Poisson với trung bình 6,1 lần mỗi ngày.

Số lần nhập viện Xác suất 0 0,0022 1 0,0137 2 0,0417 3 0,0848 4 0,1294 5 0,1579 6 0,1605 7 0,1399 8 0,1066 9 0,0723 Tổng số (0-10) 0,9530 11+ (làm phép trừ) 0,0470

Page 98: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

94

Hình 17.1 Phân phối Poisson các giá trị khác nhau của µ. Trục hoành trong các đồ thị là các giá trị của r.

Giả sử có 3 kết quả khác nhau từ buồng đếm lấp lánh dựa trên thời gian khác nhau, như trình bày trong bảng 17.2. Các kết hợp để cho số liệu chung của số đếm trong mỗi phút là cộng 3 số đếm này với nhau và chia cho tổng số thời gian:

4,6

1497,89 ===

==

148095s.e.

578,28095/14âãúm/phuït Säú

Số hạt đếm được trong một phút trung bình tương tự như số hạt đếm được trong 5 phút trong thí dụ 17.2. Dù vậy sai số chuẩn nhỏ hơn bởi vì tổng số hạt đếm được trong thời gian dài hơn.

Phân phối Poisson và tỉ suất Trong thí dụ 17.2 biến số đo lường là số các phát xạ phóng xạ đếm được trong buồng đếm lấp lánh trong 5 phút nhưng cuối cùng chúng ta tính kết quả là tỉ suất số hạt đếm được trong mỗi phút. Tỉ suất này tính được bằng cách chia số hạt đếm được và sai số chuẩn cho 5. Ở đây chúng ta thảo luận tổng quát cách phân tích tỷ suất và chúng ta dùng kí hiệu λ (kí tự Hi lạp lambda) cho tỉ suất trung bình số lần xuất hiện biến cố (nghĩa là số lần xuất hiện biến cố trung bình trong một đơn vị thời gian).

Bảng 17.2 Kết quả từ máy đếm nhấp nháy

Kết quả Số đếm Thời gian 1 1740 3 2 2300 4 3 4055 7

Tổng số 8095 14

Page 99: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

PHÂN PHỐI POISSON

95

ttes λµ

λµ

==

==

..

t gian thåìiâån vëmäüt cäú trongbiãún hiãûn láön xuáútsäú bçnh Trung

Trong thí dụ 17.2, ước lượng của µ là 2905, t bằng 5 và λ bằng 581 số hạt đếm được trong mỗi phút. Sai số chuẩn được tính bằng √µ/t theo cách trên hay √(λ/t):

8,105

581.. ==es

Cũng giống như trên. Dù vậy công thức thứ hai làm rõ thêm khi thời gian quan sát kéo dài thì sai số chuẩn sẽ giảm, bởi vì bản thân λ cũng như nhau trong thời gian dài và thời gian ngắn.

Phân tích tỉ suất mới mắc Tỉ suất mới mắc là một loại tỉ suất theo đơn vị thời gian. Nhớ lại từ Chương 15 rằng tỉ suất này bằng số r các trường hợp bệnh mới trong một khoảng thời gian chia cho số người năm nguy cơ. Phân phối Poisson (và xấp xỉ bình thường của nó) có thể được dùng khi có thể giả thiết rằng số các trường hợp xảy ra độc lập với nhau và ngẫu nhiên theo thời gian. Ðiều này dĩ nhiên ít đúng trong trường hợp bệnh truyền nhiễm hơn là bệnh không truyền nhiễm, nhưng với điều kiện không có bằng chứng mạnh mẽ về sự tập trung của bệnh, việc sử dụng vẫn xứng đáng.

cånguy nàm ngæåìi

r=λ

cånguy nàm ngæåìires =..

Thí dụ 17.3

Người ta ghi nhận được 47 trường hợp nhiễm trùng hô hấp dưới trong một nghiên cứu 2 năm ở trẻ em dưới 5 tuổi trong một cộng đồng ở Guatemala. Lúc đầu năm trăm trẻ tham gia vào nghiên cứu nhưng bởi vì có sự di chuyển, mới sinh, vượt quá 5 tuổi và không theo dõi được con số quan sát thay đổi theo thời gian. Tổng số trẻ × năm quan sát được theo dõi là 873. Tỉ suất mới mắc của nhiễm trùng hô hấp dưới, tính trên mỗi 1000 trẻ × năm được ước tính bằng

λ = 57/873 × 1000 = 65,3 cho mỗi 100 trẻ × năm

Khoảng tin cậy 95% bằng

65,3 ± 1,96 × 8,6 = 48,4 tới 82,2 nhiễm trùng cho mỗi 1000 trẻ × năm Bảng 17.3 Mới mắc nhiễm trùng hô hấp dưới trong số trẻ dưới 5 tuổi. theo điều kiện gia đình.

Tình trạng gia đình số nhiễm trùng trẻ × năm nguy cơ tỉ suất mới mắc/1000 trẻ × năm

Nghèo 33 355 93,0 Tốt 24 518 46,3 Chung 57 873 65,3

Có thể kiểm định bình thường để so sánh hai tỉ suất mới mắc, λ1 = r1/người×năm1 và λ2 = r2/người×năm2. Công thức có hiệu chỉnh tính liên tục là:

Page 100: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

96

21

21

21

))

))

nàm)ngæåìinàm)ngæåìi

nàmngæåìinàmngæåìi

nàmngæåìinàmngæåìi

××

××

++

=

+

××

+××

−−=

((

(1

(1

(21

(21||

21

21

rr

z

λ

λ

λλ

Trong đó λ là tỉ suất mới mắc toàn bộ trong 2 nhóm và λ1 - λ 2 là trị số tuyệt đối của hiệu số.

Thí dụ 17.4

Trẻ em được phân tích ở thí dụ 17.3 được chia làm 2 nhóm, sống ở nhà tốt và ở nhà nghèo. Kết quả được trình bày trong bảng 17.3. Tỉ suất mới mắc của nhiễm trùng hô hấp dưới cao hơn đáng kể trong trẻ có điều kiện sống nghèo nàn so với trẻ có điều kiện sống tốt; 93,0 và 46,3 trong 1000 trẻ-năm. Bởi vì tỉ suất này tính theo 100 trẻ-năm, thành phần trẻ năm trong công thức phải được tính theo đơn vị 1000:

52,2=

+

=

0,3551

0,5181 75,3

0,710

11,036

1 - |46,3 - 93,0|z

Sự khác biệt này có ý nghĩa cao (P < 0,01).

Page 101: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

TÍNH PHÙ HỢP CỦA PHÂN PHỐI TẦN SUẤT

97

TÍNH PHÙ HỢP CỦA PHÂN PHỐI TẦN SUẤT

Giới thiệu Chúng ta đã gặp một số phân phối lí thuyết. Trong chương này chúng ta sẽ thảo luận cách đánh giá xem phân phối của một nhóm số liệu có tuân theo một mô hình lí thuyết đặc biệt nào đó hay không. Thí dụ, có phải số liệu phù hợp với phân phối bình thường, điều kiện cần cho nhiều phương pháp thống kế. Chúng ta xem phân phối này trước tiên. Phần thứ hai tổng quát hơn. Nó mô tả kiểm định chi bình phương phù hợp (chi square goodness of fit test) để kiểm định ý nghĩa của sự khác nhau giữa phân phối tần suất quan sát được và phân phối được tiên đoán bởi mô hình lí thuyết.

Phù hợp theo phân phối bình thường Giả thiết về phân phối bình thường là nền tảng cho nhiều phương pháp thống kê. Ðiều này có thể được kiểm tra bằng cách so sánh hình dạng của phân phối tần suất quan sát được với phân phối bình thường. Ít khi cần đến kiểm định ý nghĩa hình thức (formal) bởi vì chúng ta chỉ quan tâm đến việc khám phá sự sai lệch khỏi tính bình thường một cách đáng kể; hầu hết các phương pháp đều vững vàng đối với sự di lệch vừa phải. Nếu mẫu lớn, việc đánh giá bằng mắt thường là đủ. Thí dụ, hình dạng của tổ chức đồ ở hình 18.1(a) dường như tuân theo phân phối bình thường, trong khi ở hình 18.1(b) rõ ràng bị lệch dương.

Kĩ thuật đồ họa có thể được dùng cho mẫu có kích thước bất kì là đồ thị probit (probit plot). Ðó là phân tán đồ so sánh điểm phần trăm của phân phối tần suất quan sát với điểm tương ứng (được gọi là probit) của phân phối bình thường chuẩn. Ðồ thị probit tuyến tính nếu số liệu phân phối bình thường và cong nếu số liệu không phân phối bình thường.

Thí dụ, bảng 18.1 cho thấy phân phối tần suất của nồng độ hemoglobin của 70 phụ nữ, minh họa ở hình 18.1(a). Không có phụ nữ nào có nồng độ hemoglobin dưới 8 g%. Chỉ dó một, 1,4% trong tổng số, có nồng độ dưới 9 g%. Giá trị của phân phối bình thường chuẩn tương ứng với phần trăm này có thể tìm ở bảng A6. Nó bằng -2,20, được gọi là probit của 1,4%. Nhiều người cộng 5 vào giá trị tính được để đảm bảo probit dương nhưng điều này không cần

thiết và sẽ không được tính ở đây.

Ba người phụ nữ có nồng độ hemoglobin từ 9 đến 10 g% vì vậy tổng cộng có 4 người (5,7%) có nồng độ dưới 10 g%. Dùng bảng 6 lần nữa probit tương ứng với 10g% được tính là -1,58. Tương tự có 18 phụ nữ (25,7%) có nồng độ hemoglobin dưới 11 g%. Số được tích lũy theo kiểu này được gọi là số lũy tích (cumulative). Giá trị lũy tích còn lại của phân phối tần suất được trình bày trong bảng 18.1 cùng với probit tương ứng. Người ta không thống nhất cách xử trí đối với 0% và 100% và không có cách nào hoàn toàn thuận lợi. Như ở đây chúng ta bỏ qua chúng và sẽ mất rất ít thông tin.

Bảng 18.1 phân phối tần suất nồng độ hemoglobin của 70 phụ nữ và phân phối tích lũy và probit tương ứng

Hemoglobin số phụ nữ số tích lũy tích lũy(%) probit <8 0 0 0,0 8- 1 1 1,4 -2,20 9- 3 4 5,7 -1,58

Page 102: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

98

10- 14 18 25,7 -0,65 11- 19 37 52,9 -0,07 12- 14 51 72,9 -0,61 13- 13 64 91,4 1,37 14- 5 69 98,6 2,20 15- 1 70 100,0 16+ 0

Hình 18.1(c) trình bày đồ thị probit và nồng độ hemoglobin. Lưu ý rằng probit -2,20 tương ứng với 9 g% (chứ không phải 8 g%) bởi vì nó tương ứng với phần trăm phân phối nằm dưới 9 g%. Ðồ thị này tuyến tính xác nhận rằng số liệu phân phối bình thường. Ngược lại hình 18.1(d) cho thấy đồ thị probit phi tuyến đối với phân phối chiều dày lớp mỡ dưới da vùng cơ tam đầu bị lệch dương.

Ðồ thị probit có thể vẽ bằng cách dùng từng quan sát riêng lẻ chứ không dùng phân phối tần suất. Ðiều này có thể dùng cho mẫu nhỏ. Quan sát được sắp theo thứ tự tăng dần. Phần trăm tích lũy của chúng là:

100 × 1/n, 100 × 2/n, 100 × 3/n,...., 100 × n/n

Trong đó n là cở mẫu, thí dụ nếu có 24 quan sát, phần trăm lũy tích sẽ là 4,2%, 8,4%, 13,2%,..., 100%. Các probit được tính như trên vào được vẽ theo từng giá trị cá nhân.

Kiểm định phù hợp chi bình phương Ðôi khi cần kiểm định xem một phân phối tần suất có khác biệt một cách có ý nghĩa với phân phối tần suất lí thuyết giả thiết, như là phân phối Poisson. Có thể tính được bằng cách so sánh tần suất kì vọng và tần suất quan sát dùng kiểm định chi bình phương. Loại kiểm định này cũng giống như trong bảng dự trù, đó là:

∑ −=E

EO 22 )(χ

Nhưng cách tính độ tự do có khác. Chúng bằng với số nhóm trong phân phối tần suất trừ 1, trừ số thông số tính được từ số liệu. Thí đụ nếu, nếu phân phối mũ phù hợp với thời gian sống thì chỉ cần ước lượng một thông số, đó là l, nghịch đảo của thời gian sống trung bình. Ðể phù hợp với phân phối bình thường, cần hai tham số, đó là trung bình m và độ lệch chuẩn s. Trong một số trường hợp không cần ước tính tham số, hoặc là bởi vì mô hình lí thuyết không cần tham số như trong thí dụ 18.1 hoặc là bởi vì các tham số được xác định trong mô hình.

1.. −−=

læåüng æåïc cáön säú tham caïc Säú

suáút táön phäúi phántrong nhoïm Säúfd

Page 103: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

TÍNH PHÙ HỢP CỦA PHÂN PHỐI TẦN SUẤT

99

0

5

10

15

20

8 9 10 11 12 13 14 15

Hemoglobin

SäúSäúSäúSäúphuûphuûphuûphuûnæînæînæînæî

010203040506070

2 6 10 14 20

Nãúp gáúp da (mm)Nãúp gáúp da (mm)Nãúp gáúp da (mm)Nãúp gáúp da (mm)

Säú â

aìn ä

ngSä

ú âaìn

äng

Säú â

aìn ä

ngSä

ú âaìn

äng

-3-2-10123

8 9 10 11 12 13 14 15 16

Hemoglobin

Prob

it

-3-2-10123

2 6 10 14 18 22

Nãúp gáúp da (mm)Nãúp gáúp da (mm)Nãúp gáúp da (mm)Nãúp gáúp da (mm)

Prob

it

Hình 18.1 Phân phối tần suất và đồ thị probit để đánh giá tính bình thường của số liệu. (a) và (c) Nồng độ hemoglobin của 70 phụ nữ. Phân phối bình thường. Ðồ thị probit tuyến tính. (b) (d) Chiều dày lớp mỡ dưới da vùng cơ tam đầu ở 440 người nam. Lệch dương. Ðồ thị probit phi tuyến

Tính toán số kì vọng

Bước đầu tiên trong việc tiến hành kiểm định tính phù hợp chi bình phương là ước lượng tham số cần thiết cho phân phối tần suất lí thuyết từ số liệu . Bước thì nhì là tính số kì vọng trong mỗi nhóm của phân phối tần suất, bằng cách nhân tổng số tần suất cho xác suất một cá nhân giá trị rơi vào trong nhóm

nhoïmtrong nàòmnhán caï mäüt suáút xaïc cäüng täøng suáút táön voüng kç suáút Táön ×=

Ðối với số liệu rời rạc, xác suất đươc tính bằng ứng dụng trực tiếp công thức phân phối, như được minh họa trong phân phối Poisson ở thí dụ 18.2. Ðối với số liệu liên tục, tính toán từ phân phốitích lũy. Thí dụ, nếu số liệu là thời gian sống còn của muỗi thì xác suất muỗi chết trong ngày thứ ba bằng xác suất nó sống tới đầu ngày thứ ba trừ cho xác suất nó sống tới đầu ngày thứ bốn.

Tính hợp lệ

Kiểm định tính phù hợp chi bình phươg không được dùng nếu có một tần suất kì vọng nào nhỏ hơn hai hay có nhiều tần suất kì vọng nhỏ hơn 5. có thể tránh được bằng cách kết hợp những nhóm kề nhau trong phân phối.

Thí dụ 18.1

Bảng 18.2 trình bày phân phối của kí số cuối cùng (final digit) trong trọng lượng được ghi nhận trong một cuộc điều tra để kiểm tra tính đúng của nó. Chín mươi sáu người lớn được cân và ghi trọng lượng tới 0,1 kg gần nhất. Nếu không có sai lệch trong ghi nhận, thí dụ như sai lệch do khuynh hướng ghi tròn kilogram hay ghi tròn nửa kilogram, ta kì vọng rằng số lần xuất hiện các số 0, 1, 2,..., 9 trong chữ số cuối cùng bằng nhau và bằng 9,6. Có thể kiểm định tính phù hợp của phân phối quan sát được với giả thuyết bằng cách sử dụng kiểm định tính

Page 104: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

100

phù hợp chi bình phương. Có 10 phân phối tần suất và không có tham số nào được ước lượng.

∑ =−==−= 9110..84,9)( 22 fd

EEOχ

9,84 ở giữa điểm phần trăm 25% và 50% đối với phân phối c2 9 độ tự do. Do đó tần suất quan sát phù hợp với tần suất lí thuyết, gợi ý rằng không có sai lệch ghi nhận.

Thí dụ 18.2

Người ta cho rằng sự xâm nhập bội (mulitple invasion) của Plasmodium falciparum vào hồng cầu xảy ra nhiều hơn so với các kí sinh trùng sốt rét khác. Bảng 18.3 cho thấy số liệu được thu thập để xem những kí sinh trùng này có tấn cộng vào hồng cầu một cách chọn lọc chya chỉ đơn giản là sự tình cờ. Năm mươi ngàn hồng cầu được đếm trong một phết máu của bệnh nhân bị sốt rét falciparum và ghi nhận số kí sinh trùng trong mỗi hồng cầu

Nếu nhiễm trùng một hồng cầu là một biến cố tình cờ, sự phân phối của số các kí sinh trùng cho mỗi tế bào sẽ là phân phối Poisson. Có thể kiểm định giả thuyết này bằng cách dùng kiểm định phù hợp chi bình phương. Bước đầu tiên là tính, , µ , số trung bình của kí sinh trung trong mỗi hồng cầu:

23,0

0005052011

000502149932591262181000400 ==×+×+×+×+×

Bảng 18.2 Kiểm tra tính đúng của cuộc điều tra ghi nhận trọng lượng

Kí số cuối cùng của trọng lượng

tần suất quan sát tần suất lí thuyết (O-E)2/E

0 13 9,6 1,20 1 8 9,6 0,27 2 10 9,6 0,02 3 9 9,6 0,04 4 10 9,6 0,02 5 14 9,6 2,02 6 5 9,6 2,20 7 12 9,6 0,60 8 11 9,6 0,20 9 4 9,6 3,27 Tổng số 96 96,0 9,84

Bảng 18.3 Phân phối tần suất quan sát của số các kí sinh trùng cho mỗi hồng cầu trong máu của bệnh nhận bị Plasmodium falciparum so sánh với phân phối Poisson có cùng trung bình. Ðược pháp của Wang (1970) Transaction of the Royal Society of Tropical Medicine and Hygiene 64, 268-270.

Số kí sinh trùng trong mỗi hồng cầu số quan sát phân phối Poisson (O- E)2/E 0 40000 39726,7 1,9 1 88621 9137,1 29,2 2 1259 1050,8 41,3 3 99 80,6 4,2 4 21 4,6 68,5 5+ 0 0,2 0,2 Tổng số 50000 50000 135,3

Page 105: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

TÍNH PHÙ HỢP CỦA PHÂN PHỐI TẦN SUẤT

101

Bước tiếp theo là tính số kì vọng của hồng cầu có 0, 1, 2, 3, 4, 5+ kí sinh trùng dùng phân phối Poisson với trung bình này. Kết quả được trình bày trong bảng 18.3. Thí dụ, xác suất hồng cầu có hai kí sinh trùng là:

021015,0!2

23,0!2

223,02

==−− ee µµ

Số kì vọng của hồng cầu trong tổng số 50000 hồng cầu có hai kí sinh trùng là

50000 × 0,021015 = 1050,8 Cuối cùng tần suất quan sát và tần suất kì vọng được so sánh với nhau. Có thể thấy rằng có số hồng cầu quan sát có một hay hai kí sinh trùng nhỏ hơn số kì vọng và số hồng cầu quan sát có ba hay bốn kí sinh trùng nhiều hơn kì vọng, gợi ý rằng kí sinh trùng tấn công vào tế bào có chọn lọc chứ không phải ngẫu nhiên. Giá trị chi bình phương có ý nghĩa cao.

χ2 = 135,3; d.f. = 6 - 1 - 1 = 4; P < 0,001

Page 106: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

102

PHÉP BIẾN ÐỔI

Giới thiệu Giả thuyết làm nền tảng cho phương pháp thống kế có thể không phải luôn luôn thỏa mãn bởi một nhóm số liệu nhất định. Thí dụ, phân phối có thể bị lệch dương chứ không phải bình thường, sai số chuẩn của hai nhóm có thể khác nhau không cho phép sử dụng kiểm định t để so sánh hai trung bình, hay quan hệ của hai biến có thể là đường cong chứ không phải là đường thẳng. Ở đây chúng ta sẽ mô tả cách thức vượt quan những vấn đề trên bằng phép biến đổi tới thang đo khác. Sự lựa chọn phổ biến nhất là phép biến đổi logarithm và được mô tả chi tiết. Tóm tác sử dụng các phép biến đổi sẽ được trình bày ở chương cuối.

Phép biến đổi logarithm Khi áp dụng phép biến đổi logarithm cho một biến số, mỗi giá trị sẽ được thay thế bằng logarithm của nó

u = log x Trong đó x là giá trị nguyên thủy và u là giá trị biến đổi. Chỉ có thể dùng phép biến đổi này với giá trị dương bởi vì không có logarithm cho giá trị âm và logarithm cho giá trị zero là vô hạn âm. Dầu vậy có một số trường hợp khi cần biến đổi logarithm như trong trường hợp đếm số kí sinh trùng, nhưng số liệu có một số giá trị zero cùng với các giá trị dương. Có thể giải quyết vấn đề này bằng cách cộng 1 vào các giá trị trước khi biến đổi (lưu ý rằng phải trừ đi 1

sau khi kết quả cuối cùng được biến đổi về thang đo gốc).

Phép biến đổi logarithm có tác dụng kéo dài phần bên trái của thang đo và nén phần bên phải của thang đo như chỉ ra trong hình 19.1. Thí dụn trong một thang đo logarithm thì khoảng cách giữa 1 và 10 sẽ bằng khoảng cách từ 10 đến 100 và bằng khoảng cách từ 100 đến 1000; chúng cùng có khác biệt gấp 10 lần.

Hình 19.1 Phép biến đổi logarithm

Các giá trị lệch dương

Phép biến đổi logarithm sẽ bình thường hóa các phân phối bị lệch dương, như trong hình 19.2, trong đó là kết quả sự áp dụng phép biến đổi logarithm cho số liệu lớp mỡ dưới da vùng cơ tam đầu được trình bày trong hình 18.1(b). Tổ chức đồ đối xứng và đồ thị probit tuyến đính cho thấy phép biến đổi đã loại bỏ sự lệch và bình thường hóa số liệu. Bề dày lớp mỡ dưới da được gọi là có phân phối log bình thường (lognormal distribution).

-3-2-10123

0,3 0,7 1,1 1,5

Nãúp gáúp da (mm)Nãúp gáúp da (mm)Nãúp gáúp da (mm)Nãúp gáúp da (mm)

Prob

it

020406080

100

0,3 0,7 1,1

Nãúp gáúp da (mm)Nãúp gáúp da (mm)Nãúp gáúp da (mm)Nãúp gáúp da (mm)

Säú â

aìn ä

ngSä

ú âaìn

äng

Säú â

aìn ä

ngSä

ú âaìn

äng

0

1 2 5

1

10 20 50

-1

0.1 0.2 0.5

2

100 200 500 1000

3log x

x

Page 107: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

PHÉP BIẾN ÐỔI

103

Hình 19.2 Phân phối log bình thường của bề dày lớp mỡ dưới da vùng cơ tam đầu của 440 đàn ông. So sánh với hình 18.1

Ðộ lệch chuẩn không bằng nhau

Cơ chế sử dụng phép biến đổi logarithm sẽ được mô tả bởi việc xem xét số liệu của bảng 19.1(a) cho thấy sự bài tiết ß-throboglobulin (b-TG) ở 12 bệnh nhân tiểu đường cao hơn 12 người bình thường. Những số trung bình này không thể so sánh bằng kiểm định t bởi vì độ lệch chuẩn của hai nhóm khác nhau. Cột bên phải của bảng cho thấy số quan sát sau khi biến đổi logarithm. Thí dụ log(4,1)=0,61. Có thể dùng logarithm với cơ số bất kì; kết quả cũng giống nhau. Người ta thường chọn dùng cơ số 10, như ở đây, hay cơ số e, gọi là logarithm tự nhiên (natural logarithms).

Phép biến đổi logarithm có tác động cân bằng độ lệch chuẩn ở đây (chúng là 0,26 và 0,28 trong thang đo logarithm) và loại bỏ độ lệch ở mỗi nhóm (xem hình 19.3). Kiểm định t có thể được dùng cho thấy log ß- TG trung bình cao hơn ở bệnh nhân đái đường một cách có ý nghĩa. Chi tiết tính toán được trình bày ở bảng 19.1(b).

Trung bình nhân và khoảng tin cậy

Khi sử dụng phép biến đổi, tất cả mọi phân tích được tiến hành trên giá trị đã biến đổi, u. Ðiều cần lưu ý là điều này cũng đúng trong khi tính khoảng tin cậy. Thí dụ, log ß-TG trung bình của người bình thường là 1,06 log ng/ngày/100 ml. Khoảng tin cậy của nó là

1,06 ± 2,20 × 0,26/12 = 0,89 tới 1,23 log(ng/ngày/100ml) (lưu ý rằng 2,20 là điểm 5% của phân phối t với 11 độ tự do.)

Dù vậy khi báo cáo kết quả cuối cùng đôi khi cần biến đổi ngược thành đơn vị gốc bằng cách lấy antilog như làm trong bảng 19.1(c). Antilog của trung bình của giá trị biến đổi được gọi là trung bình nhân (geometric mean).

Trung bình nhân (Geometric mean - GM) = antilog( u) = 10 u

Page 108: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

104

Thí dụ, trung bình nhân của ß-GT của đối tượng bình thường là:

Antilog(1,06) = 101,06 = 11,5 ng/ngày/100 ml 0 7010 20 30 40 50 60A

1 2 5 10 20 50 100B

Hình 19.3 ß-Thromboglobulin data (Bảng 19.1) vẽ từ (a) dùng thang đo tuyến tính và (b) dùng thang đo logarithm. Lưu ý trên thang đo logarithm vẫn ghi theo đơn vị nguyên thủy

Bảng 19.1 So sánh ß -throboglobulin (b-TG) nước tiểu ở 12 người bình thường và 12 người bị tiểu đường. Sửa đổi từ kết quả của van Oost et al. (1983). Thrombosis and Haemostasis 49, 18-20, có xin phép.

(a) Số liệu gốc và log của số liệu β-TG

(ng/ngày/100ml creatinine

Log β-TG (log ng/ngày/100ml creatinine

Bình Thường Tiểu đường Bình Thường Tiểu đường

4.1 11.5 0.61 1.06 6.3 12.1 0.80 1.08 7.8 16.1 0.89 1.21 8.5 17.8 0.93 1.25 8.9 24.0 0.95 1.38 10.4 28.8 1.02 1.46 11.5 33.9 1.06 1.53 12.0 40.7 1.08 1.61 13.8 51.3 1.14 1.71 17.6 56.2 1.25 1.75 24.3 61.7 1.39 1.79 37.2 69.2 1.57 1.84

trung bình 13.5 35.3 1.06 1.47 S.D. 9.2 20.3 0.26 0.28 n 12 12 12 12 (b) tính kiểm định t dựa trên log số liệu

s = √[11 × 0,262 + 11 × 0,282/22]=0,27

001,022..72,312/112/127,0

47,106,1 ≈=−=+

−= Pfdt

(c) kết quả báo cáo trên thang đo nguyên thủy trung bình nhân

β- TG

khoảng tin cậy 95%

độ lệch chuẩn hình học Bình thường 11,5 7,8 ; 17,0 1,8 Tiểu đường 29,5 19,5 ; 44,5 1,9

Page 109: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

PHÉP BIẾN ÐỔI

105

Trung bình nhân luôn luôn nhỏ hơn trung bình cộng tương ứng trừ khi tất cả các quan sát có cùng giá trị, trong trường hợp đó hai số đo bằng nhau. Không giống như trung bình cộng, nó không bị ảnh hưởng rõ rệt của các giá trị rất lớn trong phân phối lệch, cho nên nó đại diện cho số trung bình tốt hơn trong tình huống này.

Khoảng tin cậy được tính bằng cách antilog giới hạn tin cậy tính được trên thang đo log. Ðối với đối tượng bình thường, khoảng tin cậy 95% của trung bình nhân sẽ là:

Antilog(0,89), antilog(1,23) = 100,89, 101,23 =7,8 ; 17,0 ng/ngày/100 ml

Lưu ý rằng khoảng tin cậy này không đối xứng qua trung bình nhân. Thay vào đó tỉ số giữa giới hạn trên và trung bình nhân, 17,0/11,5 = 1,5 cũng bằng tỉ số giữa trung bình nhân và giới hạn dưới, 11,5/7,8 = 1,5. Ðiều này phản ánh độ lệch chuẩn theo thang đo log tương ứng với sai số nhân chứ không phải sai số cộng trong thang đo gốc.

Vì lí do này, antilog của độ lệch chuẩn khó có thể giải thích và do đó thường ít được dùng. Dù vậy có nhiều tình huống, thí dụ trong bảng lớn có nhiều biến số khác nhau, khi bởi vì tính ngắn gọn, người ta thích dùng antilog của độ lệch chuẩn hơn là khoảng tin cậy. Người ta đã đề nghị từ độ lệch chuẩn hình học (geometric standard deviation) (Kirwood, 1979).

Quan hệ phi tuyến

Hình 19.4(a) trình bày tần suất của lympho bào kháng 6-thioguanine (6TG) gia tăng theo tuổi. Ðường cong quan hệ hướng lên và có độ phân tán lớn hơn đối với tuổi lớn hơn. Hình 19.4(b) trình bày bằng cách dùng phép biến đổi log cho tần suất đã làm thẳng mối quan hệ và ổn định độ biến thiên.

Trong thí dụ này, đường cong quan hệ hướng lên và biến số y (tần suất) được biến đổi. Thao tác tương tự cho quan hệ với đường cong đi xuống là lấy logarithm của giá trị x.

Hình 19.4 Quan hệ giữa tần suất của lymphocyte kháng 6TG và tuổi trên 37 đối tượng được trình bày dùng (a) thang đo tuyến tính (b) thang đo logarithm của tần suất. Ðược phép của Morley et al. (1982) Mechanisms of Ageing and Development 19, 21-6

Phân tích hiệu giá

Nhiều thử nghiệm huyết thanh học, như là thử nghiệm kết dính hồng cầu dùng cho kháng thể sởi, dựa trên một loạt những lần pha loãng gấp đôi và độ pha loãng của dung dịch loãng nhất mà có phản ứng được ghi nhận. Kết quả được gọi là hiệu giá và được tính bằng độ pha loãng 1/2, 1/4, 1/8, 1/16, 1/32 v.v.. Ðể cho tiện lợi, chúng ta sẽ dùng thuộc ngữ một cách kém chặt chẽ hơn và gọi số nghịch đảo của những số này, đó là 2, 4, 8, 16, 32, v.v. Là hiệu giá. Hiệu giá có khuynh hướng bị lệch dương, và do đó cách phân tích tốt nhất là dùng phép biến đổi logarithm. Ðiều này được thực hiện đơn giản nhất bằng cách dùng số lần pha loãng thay cho hiệu giá. Do đó hiệu giá 2 được thay bằng số lần pha loãng 1, hiệu giá 4 bằng 2, hiệu giá 8

Page 110: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

106

bằng 3, hiệu giá 16 bằng 4, hiệu giá 32 bằng 5 v.v. Ðiều này tương đương với lấy logarithm cơ số 2 bởi vì như ta thấy, 8 = 23 và 16 = 24

u = số lần pha loãng = log2 hiệu giá Tất cả các phân tích được tiến hành băng cách dùng số lần pha loãng. Kết quả sau đó được biến đổi ngược trở thành giá trị ban đầu bằng cách tính 2 lũy thừa.

Thí dụ, Bảng 19.2 cho thấy kháng thể sởi của 10 đứa trẻ 1 tháng sau khi tiêm chủng vaccin sởi. Kết quả được tính bằng hiệu giá và số lần pha loãng tương ứng. Trung bình số lần pha loãng là u = 4,4. Ta lấy antilog bằng cách tính 24,4 = 21,1. Kết quả được gọi là hiệu giá trung bình nhân và bằng 21,1.

Hiệu giá trung bình nhân = 2 số lần pha loãng trung bình

Chọn phép biến đổi Như đã nói ở trên, phép biến đổi logarithm thường được áp dụng nhiều nhất. Nó thích hợp để loại bỏ tính lệch dương và được dùng trong một số các biến số như thời gian ủ bệnh, thời gian sống còn, số các kí sinh trùng, hiệu giá, liều thuốc, nồng độ chất, và tỉ số. Dù vậy có một số các phép biến đổi cho các số liệu bị lệch được tóm tắt trong bảng 19.3. Thí dụ, phép biến đổi nghịch đảo (reciprocal transformation) mạnh hơn phép biến đổi logarithm và sẽ thích hợp nếu phân phối bị lệch dương nhiều hơn phân phối bình thường, trong khi phép biến đổi lấy căn (root transformation) yếu hơn. Mặt khác tính lệch âm có thể bị loại bỏ bằng cách dùng phép biến đổi lấy lũy thừa (power transformation) như là biến đổi bậc hai hoặc bậc ba, độ mạnh tương đương với bậc của lũy thừa.

Cách chọn lựa tương tự cho việc biến đổi độ lệch chuẩn trở nên giống nhau hơn, phụ thuộc vào độ lệch chuẩn tăng như thế nào khi trung bình tăng. (ít khi giảm). Do đó, phép biến đổi logarithm thích hợp nếu độ lệch chuẩn tăng tỉ lệ với độ lệch chuẩn, trong khi phép biến đổi nghịch đảo thích hợp nếu độ dốc cao hơn và phép biến đổi căn thích hợp khi độ dốc ít hơn.

Bảng 19.3 cũng tổng kết một số loại quan hệ phi tuyến có thể xảy ra. Việc chọn lựa phụ thuộc vào hình dạng của đường cong và muốn biến đổi biến x hay biến y.

Cuối cùng ta cũng lưu ý hai phép biến đổi liên quan chặt với tỉ lệ. Chúng là phép biến đổi logistic (hay logit) được giới thiệu ở chương 14 và phép biến đổi probit được mô tả ở chương 18. Tác động chính của hai phép biến đổi này là chuyển một phạm vi giới hạn của thang đo tỉ lệ, từ zero đến1, thành thang đo vô cực.

Bảng 19.2 Nồng độ kháng thể kháng sởi một tháng sau khi tiêm chủng

Trẻ Hiệu giá kháng thể số lần pha loãng 1 8 3 2 16 4 3 16 4 4 32 5 5 8 3 6 128 7 7 16 4 8 32 5 9 32 5 10 16 4

Page 111: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

PHÉP BIẾN ÐỔI

107

Bảng 19.3 Tổng kết sự lựa chọn phép biến đổi. Phép biến đổi làm giảm tính lệch dương gọi là phép biến đổi nhóm A Phép biến đổi làm giảm tính lệch âm gọi là phép biến đổi nhóm B

Tình huống Phép biến đổi Phân phối lệch dương (nhóm A) Log bình thường (lognormal) logarithm (u = log x) Lệch nhiều hơn log bình thường nghịch đảo ( u = 1/x) Ít lệch hơn phân phối bình thường căn bậc hai ( u = x) Phân phối lệch âm (nhóm B)

Lệch vừa phải bình phương (u=x2) Lệch nhiều lũy thừa ba (u = x3) Biến thiên không đều

Ðộ lệch chuẩn tỉ lệ với trung bình logarithm (u = log x) Ðộ lệch chuẩn tỉ lệ với bình phương của trung bình nghịch đảo ( u = 1/x) Ðộ lệch chuẩn tỉ lệ với căn của trung bình căn bậc hai ( u = √x) Quan hệ phi tuyến

biến y và/hay biến x

y

x

Nhóm A Nhóm B

y

x

Nhóm B Nhóm A

y

x

Nhóm A Nhóm A

y

x

Nhóm B Nhóm B

Page 112: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

108

PHƯƠNG PHÁP PHI THAM SỐ

Giới thiệu Phương pháp phi tham số (non-parametric methods) là một nhóm các kĩ thuật thống kê nhằm phân tích số liệu mà không có các giả thuyết về phân phối làm nền tảng, thí dụ như tính bình thường của số liệu. Chúng đặc biệt hữu dụng khi không có tính bình thường trong một nhóm số liệu nhỏ mà không thể sửa chữa bằng phép biến đổi thích hợp.

Nhiều phương pháp phi thống kê được phát minh với mục đích ban đầu là tìm các phương pháp nhanh chóng và dễ dàng nhưng sau đó người ta khám phá ra rằng thành tích của chúng tốt tương đương với những phương pháp tham số cổ điển như kiểm định t. Chúng hầu như có hiệu quả tươngn đương trong việc phát hiện những sự khác biệt đơn thuần khi giả thuyết tham số được thỏa và tốt hơn đáng kể khi giả thuyết này không thỏa. Như chúng ta sẽ thấy, phương pháp phi tham số rất dễ dùng với điều kiên số liệu không có quá 50 trường hợp. Dù vậy với sự sử dụng rộng rãi máy tính và máy tính cầm tay, điều này trở nên ít quan trọng hơn trước đây. Chúng có hai nhược điểm chính. Thứ nhất, nó chú trọng chủ yếu vào kiểm định ý nghĩa và mặc dù có thể tính được khoảng tin cậy nhưng thao tác phức tạp và tiến hành rất mất công. Thứ nhì, chúng khó mở rộng ra trong các tình huống phức tạp hơn. Vì những lí do này cuốn sách này nhấn mạnh nên dùng phương pháp tham số khi chúng hợp lệ.

Bảng 20.1 Tổng kết những phương pháp phi tham số chính

Phương pháp phi tham số Sử dụng Tương đương với phương pháp tham

số Kiểm định dấu (sign test) Dạng đơn giản của Kiểm định sắp

hạng có dấu Wilcoxon

Kiểm định sắp hạng có dấu Wilcoxon (Wilcoxon sign rank test)

Kiểm định sự khác nhau giữa các cặp quan sát

Kiểm định t cặp đôi

Kiểm định tổng sắp hạng Wilcoxon (Wilcoxon rank sum test)

So sánh 2 nhóm Kiểm định t hai mẫu

Kiểm định U Mann Whitney (Mann Whitney U test)

Kiểm định S Kendall (Kendall's S test)

Thay thế cho Kiểm định tổng sắp hạng Wilcoxon cho cùng kết quả

Kiểm định t hai mẫu

Phân tích phương sai một chiều Kruskal Wallis (Kruskal Wallis one-way ANOVA)

So sánh một số nhóm Phân tích phương sai một chiều

Phân tích phương sai hai chiều Friedman (Friedman two-way ANOVA)

So sánh nhiều nhóm được xác định bởi các giá trị trên 2 biến

Phân tích phương sai hai chiều

Tương quan sắp hạng Spearman (Spearman's rank correlation)

Ðo lường sự tương quan giữa hai biến số

Hệ số tương quan

Tương quan sắp hạng Kendall (Kendall's rank correlation)

Thay thế cho tương quan sắp hạng Spearman

Hệ số tương quan

Kiểm định tính phù hợp χ2 (χ2 goodness of fit)

So sánh phân phối tần suất quan sát với lí thuyết (xem chương 18)

Kiểm định Kolmogorov-Smirnov (Kolmogorov-Smirnov test) Một mẫu

Hai mẫu

Thay thế cho kiểm định tính phù

hợp χ2 So sánh hai phân phối tần suất

Page 113: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

PHƯƠNG PHÁP PHI THAM SỐ

109

Các phương pháp phi tham số chính được liệt kê ở Bảng 20.1 cùng với các phương pháp tham số tương ứng. Có ba phương pháp phổ biến nhất là kiểm định sắp hạng có dấu Wilcoxon, kiểm định tổng sắp hạng Wilcoxon và tương quan sắp hạng Spearman sẽ được mô tả bằng cách dùng cách thí dụ đã được phân tích bởi các kĩ thuật cổ điển. Ðối với các kiểm định phi tham số khác độc giả nên đọc Siegel (1956). Nói một cách chặt chẽ, phương pháp χ2 được mô tả ở chương 13 và 14 cũng là phi tham số nhưng chúng là phương pháp chuẩn cho việc phân tích tỉ lệ và bảng dự trù, nên chúng thường được kể là phương pháp cổ điển.

Kiểm định sắp hạng có dấu Wilcoxon Ðây là kiểm định phi tham số tương đương với kiểm định t cặp đôi. Nó dùng dấu và độ lớn tương đối của số liệu chứ không dùng giá trị thực. Thí dụ xem kết quả ở bảng 20.2 cho thấy số giờ ngủ của 10 người khi dùng thuốc ngủ và khi dùng placebo, và sự khác biệt giữa chúng. Kiểm định sắp hạng có dấu Wilcoxon (Wilcoxon sign rank test) gồm 4 bước căn bản.

*Cùng hạng 3 và 4 nên được sắp hạng trung bình 1. Loại bỏ mọi hiệu số bằng zero. Sắp xếp các hiệu số còn lại theo thứ tự tăng dần của độ lớn, bỏ qua dấu và gán cho chúng hạng (rank) 1, 2, 3 v.v.. Nếu hiệu số bằng nhau, như trong trường hợp bệnh nhân 1 và bệnh nhân 2, lấy trung bình hạng của chúng. Các hạng được trình bày trong Bảng 20.2

2. Cộng các hạng có hiệu số dương và các hạng theo hiệu số âm và kí hiệu tổng này là T+ và T-

T + = 3,5 + 10 + 7 + 5 + 8 + 6+ 2 + 9 = 50,5 T - = 3,5 + 1 = 4,5

3. Nếu không có sự khác biệt hiệu quả giữa thuốc ngủ và placebo thì tổng T+ và T- phải bằng nhau. Nếu có sự khác biệt thì một tổng sẽ lớn hơn và tổng kia sẽ nhỏ hơn. Kí hiệu tổng nhỏ hơn là T

T = số nhỏ hơn của T+ và T- Trong thí dụ này T = 4,5

4. Kiểm định sắp hạng có dấu Wilcoxon dựa trên việc đánh giá T, số nhỏ hơn trong hai tổng quan sát, T+ và T-, có nhỏ hơn số nhỏ hơn được kì vọng nếu chỉ có tình cờ. So sánh giá trị thu được với giá trị quyết định (critical value) cho mức ý nghĩa 5%, 2%, 1% được trình bày ở bảng A7. Lưu ý rằng cỡ mẫu thích hợp N là số các hiệu số được sắp hạng chứ không phải tổng số các hiệu số và do đó không kể đến các hiệu số bằng zero.

Bảng 20.2 Kết quả của thử nghiệm lâm sàng để kiểm định hiệu quả của thuốc ngủ (giống số liệu với Bảng 6.1), cùng với hạng (rank) để dùng cho kiểm định sắp hạng có dấu Wilcoxon.

Số giờ ngủ Bệnh nhân thuốc placebo hiệu số hạng (bỏ qua dấu) 1 6,1 5,2 0,9 3,5* 2 7,0 7,9 -0,9 3,5* 3 8,2 3,9 4,3 10 4 7,6 4,7 2,9 7 5 6,5 5,3 1,2 5 6 8,4 5,5 3,0 8 7 6,9 4,2 2,7 6 8 6,7 6,1 0,6 2 9 7,4 3,8 3,6 9 10 5,8 6,3 -0,5 1

Page 114: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

110

N = số các hiệu số khác zero. Ngược lại với các tình huống thường thấy, kết quả có ý nghĩa nếu nó nhỏ hơn giá trị quyết định. Trong thí dụ này cỡ mẫu là mười và các điểm 5%, 2% và 1% tương ứng là 8, 5, 3. Kết quả do đó có mức ý nghĩa 2% bởi vì 4,5 nhỏ hơn 5, chỉ ra rằng thuốc ngủ hiệu quả hơn placebo.

Kiểm định tổng sắp hạng Wilcoxon Ðây là kiểm định phi tham số tương đương với kiểm định t. Việc sử dụng kiểm định này được trình bày trong khi xem xét số liệu trong bảng 20.3 trình bày trọng lượng lúc sinh của con 15 người không hút thuốc lá và 14 người hút thuốc lá nặng. Kiểm định tổng sắp hạng Wilcoxon (Wilcoxon rank sum test) bao gồm 3 bước

1. Sắp hạng các quan sát trong cả hai nhóm theo thứ tự độ lớn như trong bảng. Nếu có giá trị nào bằng nhau thì lấy trung bình của chúng

2. Cộng các hạng trong nhóm có cỡ mẫu nhỏ. Trong trường hợp này chính là nhóm người hút thuốc lá và tổng sắp hạng là 163. Nếu hai nhóm có cỡ mẫu bằng nhau thì lấy nhóm nào cũng được.

T = tổng các hạng của nhóm có cỡ mẫu nhỏ 3. So sánh tổng số này với giá trị quyết định trong bảng A8 được sắp đặt hơi khác với các bảng kiểm định ý nghĩa khác. Hãy nhìn vào hàng tương ứng với cỡ mẫu của nhóm, trong trường hợp này nó là hàng 14,15. Phạm vị của mức ý nghĩa 5% là 164 tới 256 và tương ứng với giá trị không có ý nghĩa. Nói cách khác tổng số ở dưới 164 hay trên 256 sẽ là có ý nghĩa ở mức 5%. Tổng 163 trong trường hợp này ở dưới giới hạn dưới 164 có nghĩa là trọng lượng lúc sinh của con những người hút thuốc lá nhỏ hơn con những người không hút thuốc lá một cách có ý nghĩa (P<0,05).

Bảng 20.3 So sánh trọng lượng lúc sinh của con 15 người không hút thuốc lá và trọng lượng lúc sinh của con 14 người hút thuốc lá nặng (số liệu giống như trong Bảng 7.1) với hạng dùng để dùng cho kiểm định tổng sắp hạng Wilcoxon

Không hút thuốc Hút thuốc lá nặng Trọng lượng lúc sinh Hạng Trọng lượng lúc sinh Hạng

3,99 27 3,18 7 3,79 24 2,84 5 3,60* 18 2,90 6 3,73 22 3,27 11 3,21 8 3,85 26 3,60* 18 3,52 14 4,08 28 3,23 9 3,61 20 2,76 4 3,83 25 3,60* 18 3,31 12 3,75 23 4,13 29 3,59 16 3,26 10 3,63 21 3,54 15 2,38 2 3,51 13 2,34 1 2,71 3

Tổng số = 272 Tổng số = 163 * Ðồng hạng 17, 18, 19 nên được xếp trung bình

Page 115: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

PHƯƠNG PHÁP PHI THAM SỐ

111

Tương quan sắp hạng Spearman Ðây là số đo phi tham số để đo mức độ liên hệ giữa hai biến số. Phương pháp tham số tương đương là hệ số tương quan đôi khi còn gọi là tương quan tích moment Pearson (Pearson's product moment correlation), được mô tả ở chương 9. Giá trị của mỗi biến số được sắp hạng độc lập và số đo dựa trên hiệu số giữa các cặp số liệu của hai biến. Ðiều này được minh họa bằng việc sử dụng số liệu trong Bảng 20.4 trong quan hệ giữa thể tích huyết tương và trọng lượng cơ thể của 8 người đàn ông khỏe mạnh. Có 4 bước căn bản:

1. Sắp hạng các giá trị của mỗi biến riêng, như trình bày trong bảng, nếu bất kì giá trị nào giống nhau, lấy trung bình hạng của chúng. Nếu có một số lớn các giá trị giống nhau cần phải dùng công thức điều chỉnh để tính tương quan. Người đọc tham khảo Siegel (1956) để biết chi tiết.

2. Tính hiệu số d, giữa mỗi cặp sắp hạng, bình phương chúng và cộng lại. Trong thí dụ này Sd2 bằng 16

3. Tính tương quan sắp hạng Spearman được kí hiệu bằng rs

)1(61 2

2

−Σ−=nn

drs

Trong đó n là số các đối đượng. Tương quan này có giá trị giữa -1 và +1, và cách lí giải tương tự như tương quan thông thường. 1 tương ứng với sự phù hợp hoàn toàn giữa hạng của hai biến số, zero tương ứng với sự không tương quan và -1 tương ứng với sự phù hợp nghịch đảo hoàn toàn giữa các hạng

Trong thí dụ này

81,0)18(8

1661 2 =−×

×−=sr

4. Ý nghĩa của sự liên quan được kiểm định bằng cách so sánh rs với mức ý nghĩa trong Bảng A9. Giá trị 0,81 dựa trên 8 cặp có ý nghĩa ở mức 5% bởi vì 0,81 lớn hơn giá trị quyết định 0,738 xác nhận quan hệ dương tính giữa thể tích huyết tương và trọng lượng cơ thể.

Khi có hơn 10 cặp, có thể đánh giá ý nghĩa bằng cách khác bằng cách dùng kiểm định t giống như trong hệ số tương quan bình thường.

2..,1

22 −=

−−= nfdr

nrts

s

Page 116: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

112

Bảng 20.4 Quan hệ giữa thể tích huyết tương và trọng lượng cơ thể ở 8 người đàn ông khỏe mạnh (giống số liệu trong Bảng 9.1) cùng với hạng và hiệu số hạng dùng để tính tương quan sắp hạng Spearman.

Trọng lượng cơ thể (kg)

Thể tích tuyết tương (l)

Hiệu số giữa các

hạng

Hiệu số bình

phương

Ðối tượng Giá trị(kg) Hạng Giá trị (lít) Hạng d d2 1 58,0 1 2,75 2 -1 1 2 70,0 5 2,86 4 1 1 3 74,0 8 3,37 7 1 1 4 63,5 3 2,76 3 0 0 5 62,0 2 2,62 1 1 1 6 70,5 6 3,49 8 -2 4 7 71,0 7 3,05 5 2 4 8 66,0 4 3,12 6 -2 4

Σd2= 16

Page 117: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

LẬP KẾ HOẠCH VÀ TIẾN HÀNH NGHIÊN CỨU

113

LẬP KẾ HOẠCH VÀ TIẾN HÀNH NGHIÊN CỨU

Giới thiệu Từ trước đến giờ chúng ta chỉ nhấn mạnh đến cách phân tích số liệu khi đã thu thập được chúng. Trong 7 chương còn lại chúng ta sẽ thảo luận cách lập kế hoạch (plan) và tiến hành (conduct) một nghiên cứu. Xem xét đầy đủ những vấn đề liên quan có tầm quan trọng hàng đầu, bởi vì dù có phân tích tinh vi đến đâu cũng không thể cứu vớt được một nghiên cứu quy hoạch kém hay được tiến hành sai. Chương này trình bày tổng quan những vấn đề quy hoạch có liên quan, và chương 22 thảo luận về các nguồn sai số có thể phát sinh. Chương 23 tới 25 xem xét các loại quy hoạch nghiên cứu (study design) khác nhau một cách chi tiết và chương 26 xét vấn đề cỡ mẫu, đó là cách tính số các đối tượng cần được nghiên cứu để trả lời câu hỏi quan tâm. Cuối cùng chương 27 giới thiệu về cách sử dụng máy tính.

Không thể trong một phạm vi hạn chế có thể bao trùm tất cả các lãnh vực một cách chi tiết. Mục đích là mô tả đủ để người đọc trở nên quan thuộc với khái niệm liên quan và có thể quy hoạch một nghiên cứu đơn giản và đánh giá các quy hoạch nghiên cứu của các nghiên cứu được đăng trong y văn. Cần tham khảo các sách chuyên môn được liệt kê trong thư mục, thí dụ như về nghiên cứu thử nghiệm lâm sàng và bệnh chứng, để có được những thảo luận chuyên sâu.

Cuối cùng cần lưu ý rằng không có sự đồng ý hoàn toàn về cách phân loại các loại mục tiêu và quy hoạch nghiên cứu khác nhau, cũng chẳng có một ranh giới rõ ràng giữa các loại. Tôi đã chọn và chấp nhận một sơ đồ mà tôi tin là sẽ đạt được một cách tiện lợi, thực tiễn đẻ đánh giá quy hoạch nào thích hợp cho một tình huống nhất định, chứ không phải chú trọng vào các khía cạnh lịch sử của sự phát triển cảc loại quy hoạch khác nhau.

Mục tiêu của nghiên cứu Ðiểm khởi đầu của mọi nghiên cứu là xác định rõ mục tiêu của nó bởi vì chúng sẽ xác định quy hoạch nghiên cứu thích hợp và loại số liệu cần đến. Mục tiêu có thể được phân loại thành một trong ba loại chính dưới đây. Một cuộc nghiên cứu thường có một số mục tiêu, và dĩ nhiên có thể thuộc những loại mục tiêu khác nhau.

1. Ước lượng (estimation) một số đặc tính của dân số. Thí dụ, bao nhiêu phần trăm trẻ em đã được tiêm chủng đầy đủ vaccine vào lúc tròn 3 tuổi hay trung bình số lần bị tiêu chảy hàng năm của trẻ em dưới 5 tuổi ở Bangladesh?

2. Nghiên cứu sự liên quan (association) giữa một yếu tố quan tâm và một kết cuộc nào đó, như là bệnh tật hay là chết. Thí dụ, có phải trẻ em bú mẹ ít bị chết hơn trẻ em không được bú mẹ, hay nhiễm trùng hô hấp phổ biến hơn ở những trẻ mà ba mẹ có hút thuốc lá?

3. Lượng giá (evaluation) thuốc hay trị liệu hay một can thiệp nhằm giản mới mắc (hay độ nặng) của bệnh. Thí dụ, có phải tiêm BCG giảm nguy cơ bị mụt cơm tái phát, hay việc sử dụng mùng có giảm nguy cơ sốt rét, hay có phải phun thuốc diệt côn trùng vào mùng sẽ giúp bảo vệ thêm?

Phân tích thống kê hộ tịch Ðôi khi có thể trả lời mục tiêu bằng cách dùng thống kê hộ tịch (vital statisitics) hay các thống kê y tế thu thập thường quy. Về mặt lịch sử, phân tích thống kê hộ tịch được ghi nhận đầu tiên được tiến hành bởi John Graunt ở Luân đôn, người đã xuất bản cuốn sách Natural and Political Observations upon the Bills of Mortality vào năm 1662. ngoài các điều khác, Graunt còn khẳng định rằng nam nhiều hơn nữ trong cả sinh và tử, tỉ suất tử vong trẻ em cao và sự biến thiên theo mùa của tử vong. Năm 1963, Edmund Halley dùng các giấy khai tử để xây dựng bảng sống đầu tiên (xem Chương 16). Graunt đi trước thời đại của ông và truyền thống phân tích không được tiến hành cho đến giữa thế kỉ 19 khi William Farr trở thành Tổng

Page 118: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

114

Ðăng kiểm (Registrar General) đầu tiên ở Anh và xứ Wales. Farr đã áp dụng số liệu thống kê hộ tịch vào nhiều vấn đề y tế công cộng bao gồm việc so sánh các tỉ suất tử vong giữa các nhóm nghề nghiệp khác nhau.

Xem xét các số liệu thống kê hộ tịch được thu thập thường quy về sinh, tử vong và bệnh tật cũng gợi ý cho sự liên hệ giữa bệnh tật và nguyên nhân. Thí dụ, sự gia tăng tử vong vì ung thư phổi và sự liên hệ với sự gia tăng tần suất hút thuốc lá đầu tiên được lưu ý trong số liệu thống kê hộ tịch. Giả thuyết này sau đó được kiểm định với các nghiên cứu bệnh chứng và đoàn hệ được quy hoạch đặc biệt (xem ở dưới).

Nghiên cứu quan sát Nói chung, cần tiến hành một nghiên cứu đặc biệt để thu thập số liệu thích hợp để trả lời cho một mục tiêu chuyên biệt. Mục tiêu ước lượng và quan hệ dẫn tới những nghiên cứu có bản chất quan sát (observational); diễn tiến tự nhiên của bệnh được quan sát mà nghiên cứu không có ý muốn thay đổi nó. Mục tiêu đánh giá có thể được trả lời bởi nghiên cứu quan sát hay thực nghiệm (experimental), phụ thuộc vào loại biện pháp được đánh giá và biện pháp đó đã được sử dụng hay chưa. Một thí dụ của nghiên cứu quan sát là đánh giá hiệu quả của tiêm BCG chống lại bệnh lao ở một vùng có chương trình tiêm chủng tích cực ở đó BCG được tiêm chủng thường quy, bởi vì việc lựa chọn có tiêm hay không tiêm không phụ thuộc vào người nghiên cứu. Ngược lại, thử một loại vaccine chống sốt rét mới có lẽ là thực nghiệm.

Quy hoạch nghiên cứu quan sát có thể chia thành ba loại chính, cắt ngang, cắt dọc (kể cả đoàn hệ) và nghiên cứu bệnh chứng. Sơ đồ lấy mẫu thích hợp cho nghiên cứu cắt ngang và cắt dọc được mô tả chi tiết ở Chương 23. Nói chung mục tiêu là sử dụng phương pháp mà mọi người có cơ hội được chọn bằng nhau, đó là sơ đồ xác suất cân bằng (equal probability scheme). Người có thể được chọn riêng cá nhân hay chọn thành cụm, mặc dù cần một cỡ mẫu lớn hơn cho việc chọn cụm. Dù vậy các khó khăn tài nguyên và hậu cần thường làm cho không thể xét một số lượng các cụm đủ để có một bức tranh đại diện và kết quả có khi chỉ dựa trên điều tra một cộng đồng. Ðánh giá tính đại diện là vấn đề chủ quan chứ không phải thống kê. Ðiều này ít quan trọng nếu mục tiêu chính là nghiên cứu sự liÊu quan chứ không phải là ước lượng. Phương pháp đo lường sự liên quan đươc trình bày ở Chương 24, ở đó cũng xét các khía cạnh quy hoạch đặc hiệu của nghiên cứu bệnh chứng.

Nghiên cứu cắt ngang

Nghiên cứu cắt ngang (cross-sectional study) được tiến hành tại một thời điểm trong thời gian hay trong một khoảng thời gian ngắn. Nghiên cứu cắt ngang rất nhanh, rẻ, và dễ tiến hành và có thể phân tích ngay. Bởi vì chúng có thể ước lượng những đặc tính của cộng đồng tại một thời điểm chúng thích hợp cho việc đo lường bệnh toàn bộ chứ không thích hợp cho bệnh mới mắt và khó giải thích mối liên quan tìm thấy. Thí dụ, một cuộc điều tra về onchocerca cho thấy có hai khả năng của sự liên hệ này. Thứ nhất là những người có tình trạng dinh dưỡng kém có sức đề kháng kém và do đó dễ bị mù hơn do onchocerca. Thứ nhì là tình trạng dinh dưỡng kém là hậu quả của không phải là nguyên nhân của mù lòa, bởi vì người mù không thể tự kiếm sống. Cần nghiên cứu cắt dọc để quyết định lời giải thích nào là hợp lí hơn.

Nghiên cứu cắt dọc

Trong nghiên cứu cắt dọc (longitudinal study) các cá nhân được theo dõi theo thời gian, khiến cho có thể đo lường bệnh mới mắc và các thay đổi theo thời gian và dễ dàng nghiên cứu diễn tiến tự nhiên của bệnh. Trong một vài tình huống có thể theo dõi số liệu sinh, tử vong, đợt bệnh bằng việc giám sát liên tục (continous monitoring), thí dụ bằng việc giám sát các hồ sơ đăng kí trong dân số có hệ thống khai tử. Ðôi khi việc thu thập số liệu là hồi cứu (restrospective) được tiến hành trong các hồ sơ cũ. Phổ biến hơn nó có thể là tiền cứu (prospective) và vì lí do ngày, nghiên cứu cắt dọc thường được gọi là nghiên cứu tiền cứu.

Page 119: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

LẬP KẾ HOẠCH VÀ TIẾN HÀNH NGHIÊN CỨU

115

Trong đa số các trường hợp, cách đơn giản nhất để tiến hành nghiên cứu cắt dọc là tiến hành nhiều lần điều tra cắt ngang (repeated cross- sectional surveys) ở những khoảng thời gian cố định và điều tra hay đo lường những thay đổi đã xảy ra giữa các cuộc điều tra, như sinh, tử vong, di trú, thay đổi trọng lượng hay mức kháng thể, hay xuất hiện các đợt bệnh mới. Khoảng được chọn phụ thuộc vào các yếu tố được nghiên cứu. Thí dụ, để đo lường mới mắc tiêu chảy, được đặc trung bởi sự lặp đi lặp lại những cơn bệnh ngắn, số liệu cần thu thập hàng tuần để đảm bảo nhớ lại chính xác. Ðể giám sát sự phát triển trẻ em chỉ cần đo lường mỗi một hay ba tháng.

Dân số nghiên cưu có thể là động hay cố định. Trong một dân số động (dynamic) các cá nhân rời khỏi nghiên cứu khi nó không còn tuân theo định nghĩa dân số trong khi các cá nhân mới thỏa mãn điều kiện có thể tham giaa. Một thí dụ là nghiên cứu mới mắc của bệnh tiêu chảy trong trẻ dưới 5 tuổi, trong đó việc giám sát sẽ dừng lại khi nó đạt được 5 tuổi trong khi các trẻ mới sinh được chiêu mộ vào dân số khi mới sinh. Trong tình huống cố định (fixed), dân số được xác định lúc đầu và ngoài lí do chết, di chuyển hay mất dấu theo dõi, cấu trúc dân số vẫn giữ nguyên trong suốt nghiên cứu. Một dân số cố định được gọi là đoàn hệ (cohort), như là các đoàn hệ sinh vào năm 1984 (birth cohort of 1984), đó là tất cả những người cùng sinh năm 1984. Một thí dụ khác là một đoàn hệ công nghiệp những người làm trong công nghiệp năng lượng nguyên tử giữa 1970 và 1974.

Bù lại nhiều ưu điểm, nghiên cứu cắt dọc có một số khuyết điểm. Thứ nhất việc phân tích phức tạp hơn trong nghiên cứu cắt ngang và có thể cần những phương tiện xử lí số liệu tinh vi. Việc liên kết kết quả giữa các cuộc điều traaa không dễ dàng và phải chấp nhận sự di chuyển, tử vong hay nhập cuộc mới. Cần điều chỉnh cho việc già đi của nhóm theo thời gian. Thứ nhì, cần thời gian nghiên cứu dài hơn và nhiều cuộc điều tra, tỉ suất bỏ cuộc và không đáp ứng cao hơn và vấn đề số liệu không hoàn chỉnh lớn hơn. Cuối cùng nghiên cứu cắt dọc có thể tốn kém hơn và đặc ra nhiều vấn đề hậu cần trong việc thực hiện.

Nghiên cứu bệnh chứng

Nghiên cứu bệnh chứng (case control study) được dùng để tìm hiểu sự liên hệ giữa một yếu tố nhất định và một bệnh nhất định. Việc quy hoạch rất khác với những loại nghiên cứu khác bởi vì được việc lấy mẫu được tiến hành tùy theo tình trạng bệnh tật chứ không phải theo tình trạng tiếp xúc. Một nhóm các đối tượng được xác định là có bệnh, bệnh (case) được so sánh với một nhóm không có bệnh, chứng (control). Thí dụ để đánh giá việc bú sữa mẹ có bảo vệ đứa trẻ không bị chết, nhóm bệnh gồm những đứa trẻ bị chết trong năm đầu tiên và nhóm chứng là những đứa trẻ sống trong cùng khu vực có cùng tuổi và giới tính với bệnh. Nếu giả thuyết đúng thì số bệnh sẽ ít bú sữa mẹ hơn nhóm chứng.

Nghiên cứu bệnh chứng đặc biệt thích hợp với các bệnh hiếm, bởi vì nó cần một cỡ mẫu nhỏ hơn đáng để so với nghiên cứu cắt ngang hoặc cắt dọc tương ứng. Chúng tương đối rẻ tiền, nhanh chóng, dễ tiến hành và cho phép tính số mới mắc tương đối của bệnh (xem Chương 24) trong nhóm tiếp xúc và nhóm không tiếp xúc với yếu tố quan tâm. Tính phức tạp của phương pháp nằm ở chỗ cần phải xem xét cẩn thận trong việc quy hoạch để giảm thiểu sai lệch (bias) và các phân tích tương đối tinh vi cần thiết. Ðặc biệt vấn đề chọn nhóm chứng cũng là vấn đề gây tranh luận. Nghiên cứu bệnh chứng thường thành công nhất trong việc phát hiện những tác động lớn, bởi vì nó dễ dàng thuyết phục rằng tác động đó là thực chứ không phải là hình ảnh giả tạo do quy hoạch. Cuối cùng, nghiên cứu bệnh chứng (giống như nghiên cứu cắt ngang) không thích hợp nếu như bệnh hưởng đến yếu tố nguy cơ và cũng có thể là hậu quả của yếu tố nguy cơ như trong trường hợp suy diinh dưỡng là yếu tố nguy cơ của tiêu chảy.

Nghiên cứu thực nghiệm Nghiên cứu y khoa có bản chất thực nghiệm có thể phân làm 3 nhóm chính tùy theo bản chất của đo lường được lượng giá

1. Thử nghiệm lâm sàng (clinical trials ) thuốc hay các biện pháp điều trị

Page 120: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

116

2. Thử nghiệm vaccine (vaccine trials)

3. Thử nghiệm can thiệp (intervention trials)

(a) các chế độ dự phòng (không phải vaccine), thí dụ cho thuốc chống sốt rét trong 5 năm đầu tiên của cuộc sống cho trẻ ở vùng bị lưu hành sốt rét. Những nghiên cứu ngày đôi khi còn được gọi là thử nghiệm dự phòng (prophylactic trials)

(b) Các biện pháp phòng ngừa, thí dụ như dùng mùng bảo vệ chống sốt rét.

Việc quy hoạch được thảo luận chi tiết ở Chương 25. Thành phần căn bản là việc định vị cá nhân vào các nhóm thực nghiệm khác nhau dưới sự kiểm soát của người nghiên cứu, và sự định vị này phải đảm bảo các nhóm càng giống nhau càng tốt về các mặt ngoại trừ chế độ hay biện pháp điều trị được lượng giá. Nên sử dụng thử nghiệm có kiểm soát mù đôi (double-blind controlled trial) (xem Chương 25) để tránh sai lệch (bias).

Quy hoạch bản vấn lục Trong hầu hết các cuộc nghiên cứu cần phải chuẩn bị một biểu mẫu ghi nhận được quy hoạch đặc biệt hay một bản vấn lục để thu thập số liệu. Nó phải càng ngắn gọn càng tốt và cần phải tránh sự cám dỗ muốn hỏi tất cả các câu hỏi. Bảng vấn lục quá dài sẽ làm mệt mỏi người phỏng vấn và người được phỏng vấn và có thể dẫn tới câu trả lời sai lầm. Câu hỏi phải rõ ràng và không mơ hồ và phải viết rõ ràng bởi vì chúng sẽ được đọc. Phải tránh các từ kĩ thuật hay các từ dài cũng như các câu hỏi âm tính, các câu hỏi gợi ý và các câu hỏi giả thuyết.

Cần phải suy nghĩ cẩn thận về thứ tự thu thập thông tin và bảng vấn lục sẽ được tự điền hay được người phỏng vấn hoàn thành. Phải có một tiến trình logic xuyên suốt biểu mẫu để cho nó dễ dàng theo dõi. Các câu hỏi được sắp xếp thành các phần. Cần phải chỉ rõ việc hoàn tất một phần nào đó có phụ thuộc vào câu hỏi trước đó hay không, và điểm tiếp theo của phần phải được nhận dạng dễ dàng. Tốt nhất nên giảm thiểu số bước nhảy có thể xảy ra bởi vì có thể có lầm lẫn và các phần có thể bị bỏ sót. Bản vấn lục phải được kí hiệu với tên của nghiên cứu và tên người trả lời và số danh bộ nghiên cứu. Nó phải được lập lại trên mỗi trang. Phần tiếp theo thường gồm các thông tin nhận dạng như tuổi, giới tính, và địa chỉ. Nói chung cần sắp xếp các phần tiếp theo theo thứ tự quan trọng của thông tin đối với nghiên cứu, để cho phần thông tin quan trọng nhất được thu thập khi người phỏng vấn và người được phỏng vấn đều thoải mái nhất và ít chán nhất. Dù vậy, bất cứ câu hỏi tế nhị nào phải để sau cùng.

Câu hỏi đóng và câu hỏi mở

Câu hỏi có 2 dạng, mở và đóng. Câu hỏi mở (open question) được dùng để tìm kiếm thông tin và người phỏng vấn ghi nhận câu trả lời trong dạng viết tự do. Không có định kiến về và câu trả lời nào sẽ xảy ra. Mặt khác trong câu hỏi đóng (close question), câu trả lời giới hạn ở trong danh sách các câu trả lời có thể. Danh sách này nên có một mục cho 'các ý kiến khác' với chỗ trống để viết chi tiết và mục 'không biết'. Người phỏng vấn có hướng dẫn người trả lời từ mục này tới mục khác trong danh sách hay hỏi dưới dạng mở và đánh dấu mục tương ứng với câu trả lời. Câu hỏi đóng và câu hỏi mở có ưu điểm và khuyết điểm riêng và việc chọn lựa phụ thuộc rất nhiều vào hoàn cảnh cụ thể. Trả lời cho câu hỏi đóng dễ xử lí nhưng câu hỏi mở cho nhiều chi tiết thông tin sâu sắc hơn. Một khả năng là dùng câu hỏi mở trong giai đoạn nghiên cứu dẫn dường và dùng kết quả để rút ra danh sách các câu trả lời cho câu hỏi đóng trong nghiên cứu chính.

Mã hóa

Các số liệu số phải được ghi nhận càng chi tiết càng tốt và nên ghi nhận giá trị riêng biệt chứ không mã hóa trước trong bản vấn lục thành nhiều nhóm. Xét thí dụ về tuổi. Các lựa chọn tốt là ghi ngày sinh và sau đó tính tuổi từ ngày sinh và ngày phỏng vấn. Lựa chọn tốt tiếp theo là ghi tuổi của người trả lời, thí dụ như năm cho người lớn, tháng cho trẻ nhỏ, tuần cho trẻ nhũ nhi và ngày cho trẻ sơ sinh. Các kém thuận lợi nhất là ghi nhận người trả lời thuộc nhóm tuổi nào như từ 0-4, 5-9, 10-14, 15-24, 25-44, 45-64 và 65+ tuổi. Ðơn vị đo lường phải được ghi

Page 121: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

LẬP KẾ HOẠCH VÀ TIẾN HÀNH NGHIÊN CỨU

117

rõ, thí dụ trọng lượng được tính theo kilogram hay pound và phải chỉ số số các số lẻ. Với câu hỏi đóng, mã hóa số tương ứng cần phải in dọc theo danh sách các câu trả lời. Với câu hỏi mở, cần phải mã hóa câu trả lời sau khi hoàn thành bản vấn lục và phải chừa trống cho việc mã hóa.

Nếu số liệu được nhập vào máy tính cần phải nhớ điều này khi quy hoạch bản vấn lục. Thí dụ nó có thể làm nhanh quá trình nhập liệu nếu tất cả các thông tin cần nhập đươc mã hóa thành ô dọc theo bên lề phải của biểu mẫu. Trong đa số trường hợp cần gán mã số cho câu trả lời không phải là số như mã 1 cho đàn ông và 2 cho đàn bà. Cần một ô cho mỗi số (hay mỗi kí tự), tổng số các ô cần thiết cho biến được xác định bằng số tối đa các chữ số cần ghi nhận cho biến đó. Nếu có thể tránh sử dụng mã zero bởi vì nhiều chương trình máy tính và nhiều gói phần mềm thống kê không thể phân biệt zero với không trả lời, không có số liệu.

Câu hỏi nhiều trả lời

Câu hỏi nhiều trả lời (multiple response questions) cần phải xem xét đặc biệt. Nó có thể xử trí bằng 2 cách. Thí dụ, trong nông thôn Tây Phi, một gia đình có thể dùng một hay nhiều trong tám loại nguồn nước (nước mưa, nước giếng sâu, nước giếng, suối phun, sống, hồ, cao, suối) để uống. Phương pháp thứ nhất là gán một ô cho mỗi câu trả lời có thể, trong trường hợp này là 8 ô. Mỗi ô sẽ chứa mã '1' cho việc sử dụng và '2' cho việc không sử dụng nguồn đó. Nếu một gia đình dùng nước mưa và cũng lấy nước từ sông, ô nước mưa (số một) và ô nước sông (số năm) sẽ chứa mã '1' trong khi 6 ô còn lại sẽ chứa mã '2'. Phương pháp thứ nhì là gán mã 1 tới 8 cho 8 loại nguồn nước khác nhau và quyết định số câu trả lời tối đa mà gia đình có thể trả lời. Giả sử rằng chúng ta quyết định giới hạn là 3 trả lời. Chúng ta sẽ để 3 ô mã hóa cho câu hỏi và nhập mã số của nguồn nước. Gia đình dùng nước mưa và nước sông sẽ được mã hóa 1 (nước mưa) trong ô 1 và 5 (nước sống) trong ô 2. Ô 3 sẽ để trống. Mã có thể được nhập theo thứ tự của số, như chúng ta đã làm, hay theo một thứ tự logic, như theo số lượng nước sử dụng của mỗi nguồn.

Kiểm tra số liệu Mọi bản vấn lục phải được kiểm tra kĩ lưỡng sau khi hoàn tất và khi số liệu được nhập liệu. Không thể bỏ qua tầm quan trọng của vấn đề này. Kiểm tra phải được tiến hành ngay sau khi thu thập số liệu để có cơ hội tối đa giải quyết các thắc mắc. Kiểm tra có hai loại chính, kiểm tra phạm vi và kiểm tra tính phù hợp. Kiểm tra phạm vi (range checks) loại bỏ, chẳng hạn như xuất hiện mã 3 cho giới tính, mà lẽ ra chỉ là mã 1 (nam) hay mã 2 (nữ). Kiểm tra tính phù hợp (consistency checks) phát hiện những tổ hợp không thể có của số liệu như người đàn ông mang thai, hay 3 tuổi nặng 70 kg. Phân tán đồ cho thấy sự liên hệ giữa hai biến đặc biệt hữu ích trong trường hợp này, bởi vì nó cho phép phát hiện dễ dàng các tổ hợp kì lạ.

Cần lưu ý 3 điểm cơ bản để giảm thiểu sai số xảy ra trong xử lí số liệu. Thứ nhất là tránh các việc sao chép không cần thiết số liệu từ biểu mẫu này tới biểu mẫu khác. Thứ nhì là dùng thao tác kiểm chứng (verification) trong khi nhập liệu. Số liệu được nhập hai lần, tốt nhất là bởi hai người khác nhau, bởi vì nó cho phép đánh giá độc lập các con số viết tháu. Hai tập hợp số liệu được so sánh với nhau và giải quyết các điểm không thống nhất. Thứ ba là kiểm tra các tính toán cẩn thận, hoặc là bằng sự lặp lại hay là chẳng hạn như kiểm tra lại tổng từng phần cộng lại có bằng tổng số chung hay không. Khi sử dụng máy tính, cần phải thao tác ban đầu trên một nhóm số liệu nhỏ và kiểm tra lại bằng tính tay.

Page 122: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

118

NGUỒN GỐC SAI SỐ

Giới thiệu Ðiều quan trọng là nhận thức rằng các loại sai số khác nhau có thể xâm nhập vào việc quy hoạch, tiến hành và phân tích nghiên cứu để có thể giảm thiểu sự xuất hiện sai số. Chúng ta bắt đầu bằng sự phân biệt giữa hai loại chính, sai số hệ thống (systematic) và ngẫu nhiên (random). Thí dụ, xét kết quả một thực nghiệm để đánh giá sự phù hợp giữa các điều dưỡng trong việc đo huyết áp. Bốn điều dưỡng cùng đo 10 người tình nguyện. Việc xem xét kết quả cho thấy mặc dù các điều dưỡng A, B, C không có cùng một kết quả như nhau nhưng không có một mô thức không phù hợp và giá trị trung bình giống nhau. Do đó mọi sai số xuất hiện đều là ngẫu nhiên. Ngược lại điều dưỡng D đọc huyết áp luôn luôn thấp hơn các cộng sự của cô và trung bình của cô thấp hơn 10 mmHg. Cô mắc phải sai số hệ thống và ước lượng trung bình của cô ta không đúng, thấp hơn trị số thực. Kết quả của cô ta bị sai lệch (bias).

Mỗi giai đoạn nghiên cứu đều có thể bị sai số hệ thống. Chúng nguy hiểm bởi vì sai lệch có thể dẫn đến những kết luận không hợp lệ. Mặc khác sai số ngẫu nhiên giảm độ chính xác nhưng không ảnh hưởng tới tính hợp lệ. Chúng xảy ra trong khi thu thập số liệu do bản vấn lục hay các thiết bị bị hỏng, quan sát sai, sai lầm người trả lời và trong quá trình xử lí số liệu do việc mã hóa, sao chép, nhập liệu, viết chương trình, sai số tính toán. Sai số cũng phát sinh trong khi chọn phương pháp phân tích không đúng và lí giải sai kết quả.

Sai lệch có thể được phân loại thành 3 loại chính: sai lệch chọn lựa, sai lệch thông tin và sai lệch gây nhiễu. Tất cả chúng đều dễ xảy ra trong nghiên cứu quan sát hơn trong nghiên cứu thực nghiệm, ở đó chúng có thể tránh được bằng cách dùng quy hoạch mù đôi có kiểm soát ngẫu nhiên hóa (randomized controlled double-blind design) (xem Chương 25). Chúng đặc biệt là vấn đề trong quy hoạch bệnh chứng. Chúng ta sẽ xét ngắn gọn các loại sai lệch. Ðể có thêm chi tiết tham khảo Kleinbaum et al. (1982). Sau đó chúng ta sẽ xét hai tham số, độ nhạy cảm và độ đặc hiệu, được ung để đánh giá khả năng một thao tác phân loại đúng tình trạng bệnh tật (hay tiếp xúc) của một cá nhân. Cuối cùng, chúng ta sẽ xét một trường hợp đặc biệt của sai lệch, phát sinh từ hiện tượng gọi là hồi quy về trung bình.

Sai số chọn lựa Sai số chọn lựa (selection bias) có thể do một (hay cả hai) loại khiếm khuyết khác nhau trong quy hoạch về đối tượng được chọn nghiên cứu. Thứ nhất là nếu đối tượng được chọn lọc khác biệt có hệ thống với các đối tượng không được chọn lọc. Nguyên nhân chính là tỉ suất không đáp ứng cao, thất lạc theo dõi hay cơ cấu lấy mẫu sai. Thí dụ, trong nhiều quốc gia việc nghiên cứu các trường hợp tiêu chảy nặng dựa vào bệnh viện sẽ loại bỏ các trường hợp cấp tính chết trước khi đến bệnh viện và sẽ loại bỏ chọn lọc những người sống xa bệnh viện và những gia đình có tình trạng kinh tế xã hội hay giáo dục kém, bởi vì họ là những người ít sử dụng các phương tiện y tế. Loại thứ hai là sai lệch chọn lọc trong nghiên cứu so sánh do việc chọn nhóm so sánh không đúng, khác biệt về mức độ theo dõi y khoa, về việc nhập viện, dẫn tới khả năng được chẩn đoán trong nhóm tiếp xúc cao hơn số với nhóm không tiếp xúc (ngộ biện Berkson - Berkson's fallacy), khác biệt sống còn hay khác biệt theo dõi.

Sai lệch gây nhiễu Sai lệch gây nhiễu (confounding bias) xảy ra khi có sự khác biệt quan trọng giữa các nhóm được so sánh mà sự khác biệt này có liên quan đến biến số khác tâm. Một thí dụ đã được thảo luận ở Chương 14 trong Bảng 14.4, trong đó chúng ta đã so sánh mắc toàn bộ của leptospira trong người lớn ở nông thôn và thành thị. Trong trường hợp này giới tính là biến số gây nhiễu, bởi vì không chỉ tỉ suất mắc toàn bộ cao hơn ở nam so với nữ mà cấu trúc dân số của thành thị và nông thôn khác nhau. chúng ta có thể khắc phục bằng cách xây dựng những bảng 2 × 2 riêng cho nam và cho nữ và sử dụng kiểm định χ2 Mantel-Haenszel.

Page 123: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

NGUỒN GỐC SAI SỐ

119

Vấn đề gây nhiễu là một vấn đề có thể xảy ra cho mọi nghiên cứu. Có thể kiểm soát bằng quy hoạch sử dụng kĩ thuật bắt cặp mô tả ở Chương 24 và 25, và trong nghiên cứu thực nghiệm bằng cách ngẫu nhiên hóa các cá nhân vào các nhóm thực nghiệm khác nhau. Không giống như các loại sai lệch khác, sai lệch gây nhiễu có thể được điều chỉnh trong giai đoạn phân tích.

Sai lệch thông tin Sai lệch thông tin (information bias) do sự đo lường hay trả lời sai một cách có hệ thống hay từ việc phân loại sai các tình trạng tiếp xúc và bệnh tật. Nó có nhiều nguyên nhân khác nhau. Các nguyên nhân bao gồm các sai sót trong bản vấn lục, các sai số quan sát, các sai số do người trả lời, sai số do dụng cụ. Sai sót trong bản vấn lục có thể do câu hỏi không đúng về mặt văn hóa, cách dùng từ mơ hồ hay có quá nhiều câu hỏi. Sai số quan sát có thể do hiểu lầm các thao tác, lí giải sai các câu trả lời, hay chỉ do sai lầm. Nghiêm trọng hơn, các sai số quan sát có thể làm sai lệch phát hiện của nghiên cứu do sự khác biệt trong đánh giá, trong thăm dò hay trong việc lí giải các câu trả lời còn nghi ngờ, nếu người quan sát biết được tình trạng tiếp xúc hay bệnh tật của người trả lời. Ðiều này dễ xảy ra khi người phỏng vấn biết giả thuyết của nghiên cứu.

Sai số do người trả lời có thể bắt nguồn từ việc hiểu lầm, nhớ lại sai lầm, trả lời bằng các câu trả lời được cảm nhận là 'đúng' hay do thiếu quan tâm. Trong một số trường hợp người trả lời có thể trả lời sai có ý thức, chẳng hạn như khi mắc cỡ với câu hỏi về bệnh hoa liễu hay ngại vì câu trả lời sẽ bị chuyển đến cơ quan thuế. Cuối cùng, sai số do dụng cụ là việc cân chỉnh sai, thuốc thử không tinh khiết, thuốc thử pha loãng hay trộn không đúng cách hay do kiểm định chẩn đoán sai.

Ðộ nhậy cảm và độ đặc hiệu Khả năng một thao tác phân loại đúng các cá nhân vào một trong hai nhóm, chẳng hạn như bệnh và không bệnh, tiếp xúc hay không tiếp xúc, dương tính hay âm ính, có nguy cơ cao hay không được đánh giá bởi 2 thông số độ nhạy cảm và độ đặc hiệu. Ðộ nhạy cảm (sensitivity) là tỉ lệ thực sự dương tính được chẩn đoán đúng và bằng 1 trừ cho tỉ suất âm tính giả (false negative rate). Ðộ đặc hiệu (specificity) là tỉ lệ thực sự âm tính được chẩn đoán đúng và bằng 1 trừ cho tỉ suất dương tính giả (false positive rate). Thí dụ, bảng 22.1 trình bày kết quả của một nghiên cứu dẫn đường để đánh giá khả năng bố mẹ nhớ lại đúng tình trạng tiêm chủng của trẻ, khi so với các hồ sơ sức khỏe chính thức. Trong 6 trẻ đã được tiêm chủng BCG, hầu hết, 55 trẻ được xác định đúng là đã tiêm chủng bởi cha mẹ của chúng, độ nhậy cảm tính ra là 55/60 hay 91,67%. Ngược lại 15 trong 40 trẻ không có hồ sơ về tiêm chủng BCG được bố mẹ cho là đã tiêm chủng, độ đặc hiệu là 25/40 hay 62,5%.

Số đo độ nhạy cảm và đặc hiệu rất quan trọng trong đánh giá một thử nghiệm sàng lọc (screening test). Cần lưu ý có mối liên hệ ngược giữa hai số đo này, xiết chặt (hay nới lỏng) tiêu chuẩn để cải thiện số đo này sẽ giảm độ lớn của số đo kia. Ðường phân biệt chúng phụ thuộc vào bản chất của cuộc nghiên cứu. Thí dụ, trong thiết kế một cuộc nghiên cứu để thử nghiệm một loại vaccine bệnh phong mới, lúc đầu cần loại bỏ tất cả các bệnh nhân phong.Do đó người ta mong muốn một thử nghiệm có tỉ suất phát hiện dương tính thành công

Bảng 22.1 So sánh sự nhớ lại của cha mẹ về tình trạng tiêm chủng của con với tình trạng tiêm chủng ghi trong hồ sơ sức khỏe chính thức.

Tiêm chủng BCG theo bố mẹ khai Tiêm chủng BCG theo hồ sơ

sức khỏe chính thức Có Không Tổng số

Có 55 5 60 Không 15 25 40

Tổng số 70 30 100

Page 124: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

120

cao, hay nói cách khác có độ nhạy cảm cao. Người ta không quan tâm nhiều đến độ đặc hiệu, bởi vì nó không ảnh hưởng gì nếu một trường hợp thực sự âm tính bị xác định lầm là dương tính và loại bỏ. Ngược lại, khi phát hiện các trường hợp mắc bệnh trong giai đoạn theo dõi sau khi tiêm chủng, người ta muốn một thử nghiệm có độ nhạy cảm cao, bởi vì điều quan trọng là phải tin chắc rằng tất cả các trường hợp dương tính được phát hiện là đúng, và nếu ít quan trọng hơn nếu chúng bị bỏ qua.

Hồi quy về trung bình Hồi quy về trung bình nói về một hiện tượng đầu tiên được quan sát bởi Galton khi ông ta đầu tiên lưu ý rằng chiều cao của một số con trai có khuynh hướng dần tiến trung bình so với chiều cao của cha. Do đó người cha cao dễ có người con thấp hơn họ, trong khi đối với người ta thấp thì ngược lại. Không hiểu được điều này có thẻ dẫn tới lí giải sai trong hai trường hợp. Thứ nhất là hiệu số giữa hai lần đo lường có liên quan đến số đo lần thứ nhất. Thí nhì là trường hợp chỉ những cá nhân cực đoan trong phân phối được chọn điều trị và theo dõi. Ðiều này có thể lí giải bằng cách xét sự đo huyết áp lập lại và đánh giá tác dụng của thuốc hạ áp lên huyết áp.

Hình 22.1 trình bày quan hệ giữa hai huyết áp tâm trương đọc cách nhau 6 tháng trên 50 người tình nguyện. Có thể thấy rằng ngoài sự biến thiên ngẫu nhiên có sự phù hợp giữa hai lần đo. Dù vậy bức tranh khi hiệu số giữa hai lần đọc được liên kết với trị số ban đầu sẽ khác hẳn (Hình 22.2). Có vẻ rằng có một khuynh độ đi xuống và những người có huyết áp ban đầu cao sẽ giảm huyết áp sau 6 tháng và ngược lại đối với người có huyết áp ban đầu thấp. Ðiều này hoàn toàn chỉ là sự liên hệ toán hợp giữa hiệu số (BP2 - BP1) và huyết áp lúc đầu BP1, bởi vì BP1 có mặt ở cả hai biến số.

Ðôi khi người ta muốn đánh giá có phải sự thay đổi trong điều trị có liên quan đến giá trị ban đầu. Chúng ta hãy xem xét ý nghĩa của hồi quy về trung bình đối với thử nghiệm lâm sàng của thuốc hạ huyết áp. Những thử nghiệm như vậy chỉ giới hạn ở những người có huyết áp tâm trương ban đầu cao, chẳng hạn như trên 120 mmHg. Có thể thấy từ hình 22.2 rằng những người được theo dõi trong một thời gian và đo lường lại huyết áp sẽ có số trung bình giảm đi,

Hình 22.1 Quan hệ giữa hai huyết áp tâm trương cách nhau 6 tháng trên 50 người tình nguyện cho thấy sự thay đổi rất ít. Ðương thăng là quan hệ khi hai huyết áp trong hai trường hợp giống hệt nhau.

Page 125: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

NGUỒN GỐC SAI SỐ

121

ngay cả khi không có một trị liệu nào. Do đó cần có một nhóm chứng có huyết áp tương tự và để đánh giá mức giảm huyết áp trong nhóm điều trị bằng cách so sánh với mức giảm quan sát được trong nhóm chứng.

Hình 22.2 Thay đổi trong huyết áp tâm trương vẽ với giá trị ban đầu. Tương quan âm giả tạo (r=-0,42, d.f.=48, P<0,01). Ðường thăng là đường thẳng hồi quy tương ứng với sự liên hệ này.

Hình 22.3 Thay đổi huyết áp tâm thu vẽ so với trung bình của huyết áp lần đầu và lần sau. Mối tương quan không ý nghĩa (r = -0,22, d.f.=48, P=0.12) cho thấy hình ảnh chân thật không có liên quan giữa BP2-BP1 và huyết áp.

Page 126: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

122

Ðể đánh giá xem tác dụng của thuốc có liên quan đến mức huyết áp hay không, có thể sử dụng phương pháp được đề nghị bởi Oldham (1962). Hiệu số (BP1-BP2) được vẽ đối với trung bình của giá trị huyết áp lúc đầu và lúc sau (BP1+BP2)/2 chứ không phải với giá trị ban đầu. Tương quan âm tính của những biến số này có nghĩa là có khuynh hướng người có huyết cao giảm nhiều hơn những người có huyết áp thấp và tương quan dương tính có nghĩa ngược lại. Hình 22.3 trình bày đồ thị của (BP1 - BP2) với (BP1+BP2)/2 cho số liệu của hình 22.1. Sự tương quan không có ý nghĩa có nghĩa rằng phương pháp Oldham khắc phục sự liên hệ giả tạo giữa giảm huyết áp và huyết áp ban đầu gây ra do sự hồi quy về trung bình.

Page 127: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

PHƯƠNG PHÁP LẤY MẪU

123

PHƯƠNG PHÁP LẤY MẪU

Giới thiệu Vai trò của điều trị cắt ngang và cắt dọc đã được phác họa trong Chương 21. Chúng ta sẽ mô tả các lược đồ lấy mẫu (sampling schemes) có thể được dùng. Ðôi khi một cuộc tổng điều tra (census) dân số được tiến hành nhưng thường người ta chỉ nghiên cứu một mẫu (sample). Lý do chính là tiết kiệm thời gian và tiền bạc. Bất lợi chính là ước lượng dựa trên mẫu có thể bị sai số lấy mẫu, như trình bày trong Chương 1 và Chương 3, và có thể bị sai lệch nếu mẫu không đại diện cho dân số. Việc chọn lựa cỡ mẫu để nghiên cứu để cho sai số trong một giới hạn nhất định được mô tả ở Chương 26. Chọn lựa ngẫu nhiên mẫu được đề nghị để tránh các sai lệch chọn lựa, dù là có ý hay không, và các phương pháp thích hợp sẽ được phác thảo ngắn gọn. Dù vậy chỉ ngẫu nhiên hóa không đủ để khắc phục các sai lệch khả dĩ, như đã trinh bày trong Chương 22. Thí dụ, sự không đáp ứng của một số cá nhân có thể gây sai lệch, bởi vì người không đáp ứng có thể khác với người đáp ứng về các khía cạnh cần nghiên cứu.

Chọn mẫu ngẫu nhiên đơn Trong trong mẫu ngẫu nhiên đơn (simple random sampling), bước đầu tiên là rút ra một danh sách các cá nhân trong dân số và đánh số chúng. Danh sách này được gọi là khung mẫu (sampling frame). Sau đó chọn số người cần thiết; mỗi người có một cơ hội bằng nhau được chọ. Ðiều này có thể được chọn bằng cách đánh dấu một tấm thẻ cho mỗi cá nhân, xáo lên và chọn một số thẻ. Một phương pháp tiện lợi hơn là dùng bảng số ngẫu nhiên (table of random numbers) như trong bảng A10. Ðầu tiên nhìn vào tổng số trong dân số và xem nó có bao nhiêu chữ số (digit). Sau đó chọn các số ngẫu nhiên có bấy nhiêu chữ số. Thí dụ, nếu dân số có 2432 phần tử thì cần 4 chữ số. Cuối cùng chọn một điểm khởi phát tùy ý trong bảng dự trù (không nên luôn luôn khởi phát ở cùng một chỗ) và đọc các số lên, di chuyển xuống theo cột hay ngang theo hàng cho đến khi đã chọn được số lượng cần thiết các đối tượng khác nhau. Nếu số được chọn lớn hơn tổng số dân hay nếu bằng zero, bỏ qua số đo. Lưu ý rằng sự sắp xếp các số theo cặp trong bảng chỉ có mục đích trình bày mà thôi. Có thể dùng số ngẫu nhiên do máy tính tạo ra. Dù vậy không nên dùng các số ngẫu nhiên do các máy tính cầm tay tạo ra bởi vì chúng không có phân phối ngẫu nhiên thực sự.

Thí dụ 23.1

Thử chọn một mẫu gồm 10 nhà từ một làng có 268 nhà. Bảng 23.1 trình bày một phần của Bảng A10 để minh họa cách làm. Tổng số nhà là 268 do đó cần 3 chữ số. Chúng được tạo bằng cách dùng một cặp số và một chữ số đầu tiên của cặp kế bên. Bắt đầu từ góc trên bên trái và đọc theo cột xuống, số đầu tiên là 173. Số tiếp theo là 770 quá lớn và bỏ qua, Số tiế theo trong phạm vi cần thiết là 074 hay 74. Ðiều này đươc tiếp tục cho đến khi chọn được 10 số khác nhau. Chúng được gạch dưới trong bảng. Do đó các nhà được nghiên cứu là 5, 74, 79, 83, 138, 166, 173, 201, 242, và 259.

Bảng 23.1 Một phần của bảng số ngẫu nhiên từ Bảng A10, minh họa sự lựa chọn 10 số giữa 1 và 268.

Page 128: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

124

17 37 93 23 78 87 35 20 96 43 77 04 74 47 67 21 76 33 50 25 98 10 50 71 75 12 86 73 58 07

52 42 07 44€ 38 15 51 00 13 42 49 17 46 09 62 90 52 84 77 27 79 83 86 19 62 06 76 50 03 10 83 11 46 32 24 20 14 85 88 45 07 45 32 14 08 32 98 94 07 72 00 56 76 31 38 80 22 02 53 53 42 34 07 96 88 54 42 06 87 98 13 89 51 03 74 17 76 37 13 04 97 12 25 93 47 70 33 24 03 54 16 64 36 16 00 04 43 18 66 79 45 59 34 68 49 12 72 07 34 45 20 15 37 00 49 52 85 66 60 44

( Số 074 đã được chọn

Chọn mẫu hệ thống Ðể tiện lợi, chọn từ một khung mẫu được tiến hành hệ thống thay vì ngẫu nhiên bằng cách chọn các cá nhân ở một khoảng cách nhất định trong danh sách, điểm bắt đầu được chọn ngẫu nhiên. Tí dụ để chọn mậu 5% hay 1 phần 20 trong dân đố, điểm khởi phát là được chọn ngẫu nhiên từ 1 đến 20, và sau có cứ mỗi 20 người trong danh sách chọn một. Giả sử số ngẫu nhiên được chọn là 13 thì mẫu sẽ gồm các đối tượng 13, 33, 53, 73, 93 v.v.

Lấy mẫu hệ thông tương đương với lấy mẫu ngẫu nhiên với điều kiện không có một mô thức sắp các đối tượng trong mẫu. Dù vậy người ta thích lấy mẫu ngẫu nhiên bởi vì không cần giả thiết về cấu trúc dân số.

Các lược đồ lấy mẫu phức tạp hơn Có một số tình huống trong đó lấy mẫu ngẫu nhiên đơn không thích hợp và cần các lược đồ lấy mẫu phức tạp hơn. Những tình huống đó phát sinh khi (i) không có khung mẫu và xây dựng khung mẫu rất tốn kém hay không thể được, (ii) dân số trải ra trong một khu vực rộng, chi phí và thời gian di chuyển để đi khắp khu vực không cho phép, (iii) dân số có những nhóm hoàn toàn khác biệt.

Có ba loại lược đồ lấy mẫu phức tạp cơ bản là lấy mẫu phân tầng (stratified), nhiều bậc (multi-stage) và cụm (cluster). Chúng có thể dùng riêng hay kết hợp. Nói chung mục tiêu cần phải áp dụng cho những lược đồ này là làm sao cho mỗi cá nhân một cơ hội được chọn bằng nhau, đó là dùng chúng với phương pháp chọn lựa xác suất bằng nhau (equal probability selection method - epsem).

Một điểm cần lưu ý là chỉ đối với các lược đồ epsem các giá trị của dân số chỉ được ước lượng trực tiếp bởi giá trị lấy mẫu chung (overall sample value). Nếu sử dụng các phương pháp xác suất không bằng nhau, phương pháp ước lượng giá trị dân số sẽ khác (xem Thí dụ 23.2). Trong cả hai trường hợp, việc tính toán sai số chuẩn sẽ phụ thuộc vào lược đồ lấy mẫu. Ðể thảo luận đầy đủ về các vấn đề thực tiễn có liên quan, người đọc cần tham khảo Lutz (1986) và Moser và Kalton (1971) và các chi tiết lí thuyết ở Cochran (1977) và Stuart (1984).

Page 129: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

PHƯƠNG PHÁP LẤY MẪU

125

Lấy mẫu phân tầng Lấy mẫu phân tầng được dùng khi dân số bao gồm các nhóm khác biệt, hay tầng (strata), khác nhau về các đặc tính nghiên cứu và bản thân chúng cũng cần quan tâm. Những thí dụ thường gặp là các nhóm tuổi giới tính hay các vùng khác nhau trong quốc gia. Một mẫu ngẫu nhiên đơn được rút ra từ mỗi tầng để đảm bảo rằng chúng đủ đại diện. Ước lượng chung chính xác hơn dựa vào ngẫu nhiên đơn không tính đến cấu trúc các nhóm nhỏ trong dân số. Chiến lược thường dùng là chọn các cá nhân trong mỗi tầng với tỉ lệ như nhau (lược đồ epsem), nghĩa là dùng cùng một phân số lấy mẫu (sampling fraction) cho mỗi tầng. Dù vậy, đôi khi cần phải thay đổi để cho cỡ mẫu trong mỗi tầng không quá nhỏ.

Thí dụ 23.2

Người ta muốn ước lượng tỉ suất mắc toàn bộ của bệnh trong một quốc gia với ba vùng địa lí chính, vùng đồng bằng ven biển, vùng núi và vùng bán hoang mạc. Bởi vì dân số phân phối đồng đều trong quốc gia, và bởi vì người ta nghĩ rằng địa lí có thể ảnh hưởng đến tỉ suất mắc toàn bộ của bệnh, người ta chọn một mẫu phân tầng. Bảng 23.2 trình bày kết quả thu được với tỉ suất mắc toàn bộ trong mỗi vùng.

Tỉ suất mắc toàn bộ chung được tính bằng cách ước lượng số người bị bệnh trong mỗi vùng. Thí dụ trong vùng đồng bằng ven biển tỉ suất mắc toàn bộ của mẫu là 120/200 hay 0,6. Áp dụng số này cho tổng số dân số trong vùng đồng bằng ven biển cho số ước lượng 0,5 × 1500000 = 900000 người bị bệnh. Số người bị bệnh của vùng núi và bán hoang mạc được tính tương tự là 15000 và 90000. Tổng số người bị bệnh trong toàn quốc gia là 1050000. Kích thước dân số là 1950000 cho nên tỉ suất mắc toàn bộ chung là 1050000/1950000 = 0,52.

Lưu lý rằng số này không giống như tỉ suất mắc toàn bộ của mẫu là 140/300 = 0,47. Hai kết quả chỉ giống nhau khi dùng phân số lấy mẫu giống nhau cho mỗi tầng (nhưng không xảy ra trong trường hợp này). Việc tính toán sai số chuẩn của tỉ suất mắc toàn bộ cho toàn dân số dựa trên sự kết hợp các sai số chuẩn của của các tỉ suất mắc toàn bộ của mỗi vùng. Xem Moser và Kalton (1971) để biết thêm chi tiết.

Lấy mẫu nhiều bậc Lấy mẫu nhiều bậc (multi-stage sampling) được tiến hành trong nhiều bâc dùng các cấu trúc đẳng cấp (hierarchical structure) của dân số. Thí dụ, lấy mẫu hai bậc (two stage sampling) có thể bao gồm lần thứ nhất lấy một mẫu ngẫu nhiên các trường hợp và sau đó lấy một mẫu ngẫu nhiên các trẻ em trong các trường được chọn. Các trường được gọi là đơn vị bậc một (first stage units) và trẻ em là đơn vị bậc hai (second-stage units). Ưu điểm là tài nguyên có thể được tập trung tại một số địa điểm và không cần cơ cấu lấy mẫu cho toàn dân số. Cần danh sách các đơn vị bậc một nhưng chỉ cần danh sách các đơn vị bậc hai của các đơn vị bậc một đã được chọn. Khuyết điểm là ước lượng chung kém chính xác hơn khi dựa trên lấy mẫu ngẫu nhiên đơn có cùng một cỡ mẫu chung. Nó cách khác, để đạt được cùng độ chính xác như lấy mẫu ngẫu nhiên đơn cần một cỡ mẫu lớn hơn.

Bảng 23.2 Kết quả một mẫu phân tầng được tiến hành để ước lượng tỉ suất mắc toàn bộ của một bệnh trong một quốc gia có ba vùng địa lí chính. Tỉ suất mắc toàn bộ chung được tính bằng cách cộng số các người bị bệnh ước lượng được trong mỗi vùng và chia cho tổng số dân.

Khu vực dân số cỡ mẫu số bị bệnh tỉ suất mắc toàn bộ

tổng số bị bệnh ước lượng

Ðồng bằng ven biển

150000 200 120 0,6 900 000

Vùng núi 150000 50 5 0,1 15 000 Bán hoang mạc 300000 50 15 0,3 90 000 Tổng số 1950000 300 140 *0,52 1 005 000

Page 130: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

126

Lấy mẫu ở bậc hai gồm lấy các mẫu ngẫu nhiên đơn có cùng cỡ ctừ các đơn vị bậc một. Phương páp lấy mẫu bậc một phụ thuộc vào chúng có chứa một số các đơn vị bậc hai như nhau hay không. Nếu có, có thể mẫu mẫu ngẫu nhiên đơn. Nếu chúng có cỡ khác nhau, có thể đạt được lược đồ epsem, bằng cách lấy mẫu xác suất tỉ lệ với kích thước (probability proportional to size - p.p.s). Thí dụ, nếu một trường có nhiều gấp đôi học sinh so với trường kia nó có cơ hội được chọn gấp đôi. Lấy mẫu p.p.s. Ðược tiến hành hoàn lại mẫu (with replacement), có nghĩa là sau khi một đơn vị bậc một được chọn nó vẫn còn được rút chọn và có thể được chọn lần nữa. Khi một đơn vị bậc một được chọn hai lần, chọn mẫu đơn vị bậc hai nhiều gấp đôi. Tác dụng chung là cho mỗi đơn vị bậc hai trong dân số một cơ hội được chọn bằng nhau.

Có thể có lược đồ lấy mẫu có hơn hai mức lấy mẫu, thí dụ như chọn tỉnh, quận, đường phố và cuối cùng là nhà. Nó được gọi là lấy mẫu nhiều bậc (multi-stage sampling).

Lấy mẫu cụm Nếu chi phí phụ trội không nhiều, nên điều tra tất cả các đơn vị bậc hai từ mỗi đơn vị bậc một được chọn trong lược đồ lấy mẫu hai bậc. Ðiều đó được gọi là lấy mẫu cụm (cluster sampling) và đơn vị lấy mẫu bậc một được gọi là cụm (cluster) trong trường hợp này. Có thể đạt được lược đồ xác suất bằng nhau bằng cách lấy mẫu ngẫu nhiên đơn các cụm bất kể rằng chúng có kích thước bằng nhau hay không.

Lấy mẫu cụm được dùng nếu có lợi ích được phân phát cho người tham gia và nếu không thích hợp hoặc không đạo đức nếu chỉ phân phát cho một số thành viên của đơn vị. Thí dụ, trong khi lấy mẫu trường để ước lượng tỉ suất mắc toàn bộ của bệnh khi muốn sử dụng một phương pháp điều trị hiệu quả cho tất cả những người bị bệnh, người ta sẽ muốn khám tất cả các học sinh trong các trường được chọn chứ không khám một mẫu trong đó.

Thí dụ 23.3

Lấy mẫu phân tầng được đề nghị trong thí dụ 23.2 để ước lượng tỉ suất mắc toàn bộ trong một quốc gia với 3 vùng chính có thể được cải tiến thành mẫu cộng đồng thứ nhất (thành phố, làng, ấp) và các hàn tong vùng, khám tất cả các thành viên trong nhà. Lược đồ sẽ là sự kết hợp giữa lấy mãu phân tầng (khu vực) lấy mẫu hai bậc (cộng đồng và nhà) và lấy mẫu cụm (tất cả các thành viên trong nhà).

Page 131: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

NGHIÊN CỨU ÐOÀN HỆ VÀ BỆNH CHỨNG

127

NGHIÊN CỨU ÐOÀN HỆ VÀ BỆNH CHỨNG

Giới thiệu Ưu và khuyết điểm của phương pháp bệnh chứng so với phương pháp đoàn hệ (hay cắt dọc) đã được thảo luận ở chương 21. Một nghiên cứu đoàn hệ gồm theo dõi các cá nhân từ khi xác định tình trạng tiếp xúc đến sự xuất hiện bệnh sau đó. Ngược lại, nghiên cứu bệnh chứng bắt đầu với tình trạng bệnh tật của cá nhân và nhìn ngược lại thời gian để xác định tình trạng tiếp xúc trong quá khứ đối với yếu tố nguy cơ quan tâm. Vì lí do này các từ tiền cứu (prospective) và hồi cứu (retrospective) thường được dùng lẫn lộn với đoàn hệ và bệnh chứng. Dù vậy cách dùng từ này gây lầm lẫn và không nên dùng bởi vì như đã lưu ý trong Chương 21, đôi khi có thể tiến hành nghiên cứu đoàn hệ hoàn toàn hồi cứu trong các hồ sơ cũ.

Trong chương này chúng ta sẽ tập trung vào việc đo lương mối liên hệ dùng để đánh giá sức mạnh của quan hệ giữa yếu tố nguy cơ và sự xuất hiện bệnh sau đó. Nghiên cứu bệnh chứng được hiểu dễ dàng bằng cách hiểu rằng đằng sau mỗi nghiên cứu bệnh chứng có một nghiên cứu đoàn hệ tương đương. Do đó chúng ta xem nghiên cứu đoàn hệ trước.

Nghiên cứu đoàn hệ Trong nghiên cứu đoàn hệ, một mẫu các cá nhân, một số tiếp xúc với yếu tố nguy cơ quan tâm và một số không, được theo dõi theo thời gian và tỉ suất mắc bệnh của hai nhóm được so sánh với nhau. Thí dụ, Bảng 24.1 cho thấy một số liệu từ một nghiên cứu đoàn hệ để điều tra mối liên hệ giữa hút thuốc lá và ung thư phổi. Ba mươi ngàn người hút thuốc và 60000 ngàn người không hút thuốc được theo dõi trong một năm, trong thời gian đó 39 người hút thuốc và 6 người không hút thuốc bị ung thư phổi, tính ra nguy cơ mới mắc tương ứng là 1,3 và 0,1 cho mỗi 1000 người mỗi năm. Do đó nguy cơ mới mắc ung thư phổi coa hơn đáng kể trong những người hút thuốc so với người không hút thuốc. Trên thực tế chúng 13 lần cao hơn. Tỉ số này được gọi là nguy cơ tương đối (relative risk) và tổng kết đươc sức mạnh của mối liên hệ giữa yếu tố và bệnh tật.

Nguy cơ tương đối

xuïctiãúpkhäng nhoïmtrong màõc måïi suáút Tè xuïctiãúp nhoïmtrong màõc måïi suáút Tè (RR) âäúitæång cåNguy =

Nguy cơ tương đối (Relative risk - RR) bằng 1 xảy ra khi tỉ suất mới mắc như nhau trong hai nhóm và tương đương với không có mối liên hệ giữa yếu tố nguy cơ và bệnh. Nguy cơ tương đối lớn hơn 1 khi nguy cơ mắc bệnh cao ở nhóm tiếp xúc với yếu tố hơn nhóm không tiếp xúc với yếu tố, như trong thí dụ trên với tiếp xúc là hút thuốc lá. Nguy cơ tương đối nhỏ hơn một khi nguy cơ trong nhóm tiếp xúc thấp hơn, gợi ý rằng yếu tố có thể là bảo vệ. Một thí dụ là nguy cơ tiêu chảy giảm được quan sát trong những trẻ bú sữa mẹ so với những trẻ không bú.

Bảng 24.1 Số liệu từ một cuộc nghiên cứu đoàn hệ để điều tra mối liên hệ giữa hút thuốc lá và ung thư phổi. Có minh họa tính toán nguy cơ tương đối và quy trách.

ung thư phổi không ung thư phổi

tổng số Tỉ suất mới mắc

Người hút thuốc 39 29961 300000 1,3/1000/năm Không hút thuốc 6 59994 60000 0,1/1000/năm Tổng số 45 89955 90000

0,1310,130,1 ==RR

AR = 1,3 - 0,1 = 1,2/1000/năm AR% = %3,92923,0

30.120.1 ==

Page 132: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

128

Nguy cơ tương đối càng xa một bao nhiêu thì liên hệ càng mạnh bấy nhiêu. Ý nghĩa thống kê có thể được kiểm định bằng cách dùng kiểm định χ2 2 × 2 được mô tả ở Chương 13.

Khoảng tin cậy của RR

Việc tính toán khoảng tin cậy khá phức tạp. Công thức ở đây là của Miettinen. Nó là xấp xỉ dựa trên kiểm định có nghĩa là nó đươc tính dựa trên giá trị χ2 (trên thực tế là căn của χ2) tìm được trong kiểm định ý nghĩa chứ không phải là sai số chuẩn.

)/96,11(..%95 χ±=RRic

Có thể tính được khoảng tin cậy phần trăm khác bằng cách thay 1,96 với điểm phần trăm thích hợp trong phân phối bình thường.

Thí dụ, xem số liệu được trình bày trong bảng 24.1

RR = 13,0, χ2= 52,25, P <0,001 Do đó

χ = (55,25 = 7,43 và 1,96/ χ = 1,96/7,43 = 0,26 Nên

RR (1+1,96/χ) = 13,01+0,26 = 13,01,26 = 25,3 Và

RR (1 - 1,96/χ) = 13,01-0,26 = 13,00,74 = 6,7 Khoảng tin cậy 95% của nguy cơ tương đối do đó là 6,7 đến 25,3

Nguy cơ qui trách Nguy cơ tương đối đánh giá, chẳng hạn như môt người hút thuốc lá có thể bị ung thư phổi gấp bao nhiêu lần người không hút thuốc, nhưng không nói gì đến độ lớn của nguy cơ vượt quá theo số tuyệt đối. Số này được đo lường bởi nguy cơ quy trách (attributable risk - AR).

xuïctiãúpkhäng nhoïmtrong màõc måïi suáút tè

xuïctiãúp nhoïmtrong màõc måïi suáút tè

(AR)traïchquy cåNguy

−=

Nguy cơ quy trách đôi khi được tính bằng tỉ lệ so với tổng số tỉ suất mới mắc trong nhóm tiếp xúc và được gọi là phần trăm nguy cơ quy trách (attributable risk percent) hay nguy cơ quy trách tỉ lệ (proportional attributable risk), tỉ lệ quy trách (tiếp xúc), phân số quy trách (tiếp xúc) và phân số căn nguyên (tiếp xúc).

RRRR 1−=

−=

xuïctiãúp nhoïmtrong màõc måïi suáút Tè xuïctiãúpkhäng nhoïmtrong

màõc måïi suáút Tè xuïctiãúp nhoïmtrong

màõc måïi suáút Tè

AR%lãû tè traïchquy cåNguy

Trong thí dụ này, nguy cơ quy trách của ung thư phổi do hút thuốc lá là 13,0 - 0,10 = 1,2 trường hợp cho mỗi 1000 mỗi năm, với hút thuốc lá chịu trách nhiệm cho 92,3% (1,20/1,30) tất cả các trường hợp ung thư phổi trong những người hút thuốc.

Page 133: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

NGHIÊN CỨU ÐOÀN HỆ VÀ BỆNH CHỨNG

129

Bảng 24.2 trình bày nguy cơ tương đối và nguy cơ quy trách của tử vong từ các nguyên nhân khác nhau liên hệ đến hút thuốc lá nặng. Mối liên hệ được minh họa rõ nhất đối với ung thư phổi và viêm phế quản mãn tính, với nguy cơ tương đối tương ứng là 32,1 và 21,2. Dù vậy, nếu sự liên hệ với bệnh tim mạch, dù là không mạnh như thế, cũng được xem có tính nhân quả, loại bỏ hút thuốc lá sẽ cứu được nhiều bệnh nhân chết vì tim mạch hơn là vì ung thư phổi, 2,61 so với 2,20 cho mỗi 1000 người hút thuốc lá mỗi năm. Lưu ý rằng tỉ suất tử vong được chuẩn hóa để xét đến sự khác biệt do phân phối giữa người hút thuốc và người không hút thuốc, và sự gia tăng tỉ suất chết theo tuổi.

Nói tóm lại, nguy cơ tương đối là đo lường tốt nhất giữa sức mạnh của sự liên hệ giữa yếu tố nguy cơ và bệnh tật. Nó càng lớn thì càng có thể rằng mối liên quan là nhân quả. Mặt khác, nguy cơ quy trách cho ý niệm tốt hơn về nguy cơ thặng dư của bệnh do một cá nhân gánh chịu do sự tiếp xúc. Dù vậy, tổng số tác động của yếu tố nguy cơ trong dân số sẽ phụ thuộc sự tiếp xúc phổ biến như thế nào. Tính theo dân số, sự tiếp xúc hiếm với nguy cơ tương đối cao có thể ít quan trọng hơn một tiếp xúc rất phổ biến với nguy cơ tương đối thấp hơn. Ðiều này có thể được đánh giá bằng tỷ suất mới mắc chung trong dân số so với tủ suất mới mắc trong nhóm không tiếp xúc. Số này gọi là nguy cơ quy trách dân số (population attributable risk).

xuïctiãúpkhäng nhoïmtrong màõc måïi suáút tè

chung säú dántrong màõc måïi suáút tè

(PAR)säú dán traïchquy cåNguy −=

Nó có thể được tính bằng tỉ lệ của tỉ suất mắc chung. Số này được gọi là phân số quy trách dân số (population attributable fraction), tên gọi khác là phân số căn nguyên (dân số) hay nguy cơ uy trách tỉ lệ dân số (population proportional attributable risk).

)1(

)1(

−+

−=

−=

RRRR

xuïctiãúp

xuïctiãúp

lãû tè1lãû tè

chung säú dántrong màõc måïi suáút Tè xuïctiãúpkhäng nhoïmtrong

màõc måïi suáút Tèchung säú dántrong

màõc måïi suáút Tè

PARsäúû dán traïchquy säú Phán

Tỉ suất mới mắc, nguy cơ mới mắc và tỉ số số chênh

Nhớ lại từ Chương 15 rằng số mới mắc có thể là nguy cơ hay một tỉ suất. Việc tính toán nguy cơ mới mắc dựa trên dân số nguy cơ ở lúc đầu nghiên cứu, trong khi tỉ suất dựa vào tổng số người năm nguy cơ trong nghiên cứu và phản ánh sự thay đổi của dân số nguy cơ. Ðiều này đươc minh họa trong hình 24.1 phản ánh sự tích lũy dần dàn các trường hợp bệnh từ những người không bị bệnh ở trong dân số tiếp xúc và không tiếp xúc.

Bảng 24.2 Nguy cơ tương đối và quy trách của tử vong do các nguyên nhân khác nhau, 1951 đến 1961, liên hệ với hút thuốc lá nặng ở các nam bác sĩ người Anh. Số liệu từ Doll & Hill (1964), Bristish medical journal 1, 1399-1410, được trình bày bởi MacMahon & Pugh (1970) Epidemilogy, Principles and Methods. Little, Brown & Co., Boston (đã xin phép)

tỉ suất tử vong đặc hiệu tuổi (cho mỗi 1000 người-năm)

Nguyên nhân chết Không hút thuốc lá

Hút thuốc nặng RR AR

Ung thư phổi 0,07 2,27 32,4 2,20 Các ung thư khác 1,91 2,59 1,4 0,68 Viêm phế quản mãn

0,05 1,06 21,2 1,01

Bệnh tim mạch 7,32 9,93 1,4 2,61 Các nguyên nhân 12,06 19,67 1,6 7,61

Page 134: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

130

Một cách khác để đo lường mới mắc là số chênh (odds) của bệnh so với không bệnh. Nó bằng tổng số các trường hợp bệnh chia cho tổng số người nguy cơ ở cuối nghiên cứu. Dùng kí hiệu trong bảng 24.3, số chênh trong nhóm tiếp xúc là a/b và trong nhóm không tiếp xúc là c/d. Tỉ số này được gọi là tỉ số số chênh (odds ratio). Nó bằng;

bcad

dcba =

//

Là tích chéo của bảng. Tỉ số số chênh được ước tính từ bảng 24.1 bằng (39 × 59994) / (6 × 29961) = 13,0

Tỉ số số chênh (OR) = ad/bc Tỉ số số chênh cũng có thể được xem là tỉ số của số chênh tiếp xúc và không tiếp xúc trong nhóm bệnh (a/c) so với nhóm không bệnh (b/d). Vì lí do này nó đóng vai trò quan trọng trong nghiên cứu bệnh- chứng (xem ở dưới).

Trong các bệnh hiếm, đó là bệnh mà tỉ lệ các trường hợp bệnh trong dân số rất thấp, đường trong hình 24,1 cho thấy sự tích lũy của các trường hợp bệnh sẽ hầu như nằm ngang và không thể phân biệt với đường ở trên thể hiện dân số nghiên cứu. Trong trường hợp này nguy cơ mới mắc, tỉ suất mới mắc và tỉ số số chênh bằng nhau.

Page 135: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

NGHIÊN CỨU ÐOÀN HỆ VÀ BỆNH CHỨNG

131

Nguy cåban âáöu

(e)Nguy cåhiãûn taûi

Säú bãûnh(a)

Säú khäng bãûnh -coìn nguy cå

(b)

Nguy cåban âáöu

(f)Nguy cåhiãûn taûi

Säú bãûnh(c)

Säú khäng bãûnh -coìn nguy cå

(d)

(i) Dán säú tiãúp xuïc

(i) Dán säú khäng tiãúp xuïc

Xuáút hiãûnca måïi

Kãút thuïcnghiãn cæïu

Khåíi âáöunghiãn cæïu

Hình 24.1 Một trình bày hình ảnh một nghiên cứu đoàn hệ. Có 3 số đo của mới mắc tương đối là:

bcad

dca/bb

a

fcea

==

=

=

/

//(

//

chãnh säú säú Tè

xuïc)tiãúpkhäng (pyar xuïc)tiãúppyar

màõc) måïi suáút tèduûng (Sæíâäúitæång cåNguy

màõc) måïi cånguy duûng (sæíâäúitæång cåNguy

Dù vậy, đối với các bệnh phổ biến, ba số này khác nhau và sẽ cho 3 số đo mối liên hê giữa yếu tố và bệnh khác nhau, nguy cơ tương đối dùng nguy cơ mới mắc, nguy cơ tương đối dùng tỉ suất mới mắc và tỉ số số chênh. Cách thông thường là chọn tỉ suất mới mắc. Dù vậy việc chọn nguy cơ mới mắc thích hợp hơn khi đánh giá tác dụng bảo vệ của sự tiếp xúc, thí dụ như vaccine mà người ta tin rằng nó bảo vệ đầy đủ với một số cá nhân nhưng không đối với các cá nhân khác, chứ không phải bảo vệ một phần cho tất cả (Smith et al. 1984). Tỉ số số chênh được dùng trong nghiên cứu bệnh chứng (xem ở dưới).

Page 136: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

132

Nghiên cứu bệnh chứng Trong nghiên cứu bệnh chứng (case-control study), mẫu được lấy theo tình trạng bệnh chứ không phải theo tình trạng tiếp xúc. Một nhóm người được xác định có bệnh, nhóm bệnh (cases), được so sánh với một nhóm người không có bệnh, nhóm chứng (control) về phương diện tiếp xúc trước đó đối với yếu tố quan tâm. Không thể trực tiếp thu được thông tin về bệnh mới mắc trong dân số tiếp xúc và không tiếp xúc, nhưng có thể thấy rằng tỉ số tích chéo (cross product ratio) trong bảng bệnh chứng ước lượng tỉ số số chênh. Ðối với bệnh hiếm, nó bàng với nguy cơ tương đối.

Bảng 24.4 trình bày kết quả của một nghiên cứu bệnh chứng tìm hiểu mối liên quan giữa uống cà phê và ung thư tuyến tụy. Người ta thu được nguy cơ tương đối là 2,5, có nghĩa là phụ nữ uống cà phê dễ bị ung thư gấp 2,5 lần hơn những người không uống.

|OR|RR||0 ad/bc, OR : biãúnphäø BãûnhRR ad/bc OR :hiãúm Bãûnh

<<=

==

Bảng 24.4 Kết quả nghiên cứu bệnh chứng tìm hiểu sự liên hệ giữa uống cà phê và ung thư tụy. Số liệu ở phụ nữ được trình bày. Với sự cho phép của MacMahon và cộng sự (1981) New England Journal of Medicine 304,630-3.

Uống cà phê Bệnh Chứng Tổng số

Có 140 280 420

Không 11 56 67

Tổng số 151 336 487

5,2

2801156140 =

××=OR

Ðối với bệnh phổ biến, ý nghĩa của tỉ số tích chéo phụ thuộc vào lược đồ lấy mẫu được dùng cho nhóm chứng (Smith et al. 1984). Người ta thường chọn nhóm chứng từ những người không bị bệnh ở cuối cuộc nghiên cứu; bất cứ người chứng đươc chọn trong quá trình nghiên cứu sau đó mắc bệnh được coi là bệnh chứ không phải là chứng. Trong trường hợp này có thể thấy rằng tỉ số tích chéo đại diện cho tỉ số số chênh, và độ lớn của tỉ số số chênh |OR| lớn hơn độ lớn của nguy cơ tương đối.

Các biến gây nhiễu

Trong quy hoạch và phân tích các nghiên cứu bệnh chứng, điều quan trọng là đảm bảo không có biến số gây nhiễu có thể gây sai lệch trong nghiên cứu mối liên quan. Thí dụ, trong nghiên cứu uống cà phê và ung thư tụy, cần thiết đảm bảo rằng phân phối tuổi của 2 nhóm bệnh và chứng tương tự nhau, bởi vì nguy cơ ung thư tuyến tụy gia tăng với tuổi. Ðiều này có thể sắp xếp bằng cách hoặc là chọn số bệnh bằng số chứng trong mỗi nhóm tuổi (bắt cặp tầng - stratum matching) hay dùng một quy hoạch bắt cặp (xem ở dưới). Một cách khác, có thể xét đến biến số gây nhiễu trong khi phân tích, thí dụ như chia số liệu thành những nhóm tuổi khác nhau và tính tỉ số số chênh cho mỗi nhóm. Tính ước lượng chung bằng cách tính ad/n và bc/n trong mỗi bảng. Những ad/n này được cộng với nhau và chia cho tổng số các bc/n. Số

Bảng 24.3 Kí hiệu cho nghiên cứu đoàn hệ và nghiên cứu bệnh chứng không bắt cặp

Bệnh không bệnh tổng số Tiếp xúc a b e Khôngtiếp xúc c d f Tổng số g h n

Page 137: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

NGHIÊN CỨU ÐOÀN HỆ VÀ BỆNH CHỨNG

133

này được gọi là ước lượng Mantel-Haenszel của tỉ số số chênh và kiểm định ý nghĩa thích hợp là kiểm định χ2 tổng kết Mantel-Haenszel (xem Chương 14).

nbdnadOR

//

ΣΣ=Haenszel-Mantel

Một cách tiếp cận tinh vi hơn là dùng hồi quy logistic (xem Chương 14), và để ước lương tỉ số số chênh từ hệ số hồi quy. Hồi quy này thích hợp để kiểm soát đồng thời nhiều yếu tố gây nhiễu, trong trường hợp này số các nhóm nhỏ lớn và số các cá nhân trong mỗi nhóm lại rất nhỏ. Xem chi tiết ở Breslow và Day (1980) và Schlesselman (1982).

Quy hoạch bắt cặp

Trong quy hoạch bắt cặp (matched design), mỗi bệnh được bắt cặp với một hay nhiều chứng, được chọn sao cho các biến số gây nhiễu có cùng giá trị. Thí dụ, Bảng 24.5 trình bày số liệu từ một nghiên cứu tìm hiểu mối liên hệ giữa sử dụng thuốc ngừa thai và thuyên tắc mạch. Bệnh gồm 175 phụ nữ tuổi từ 15-44 được xuất viện từ 43 bệnh viện sau khi cơn thuyên tắc mạch đầu tiên. Một bệnh nhân nữ bị một bênh khác (không liên quan đến việc sử dụng thuốc ngừa thai) được chọn lọc từ cùng một bệnh viện để làm chứng cho mỗi bệnh. Người chứng được chọn có cùng nơi cư ngụ, cùng thời gian nhập viện, chủng tộc, tuổi tác, tình trạng hôn nhân, tình trạng thai sản và tình hình thu nhập y như người bệnh. Người tham gia được hỏi về tiền căn dùng thuốc ngừa thai và đặc biệt là họ có dùng thuốc ngừa thai vào tháng trước nhập viện hay không.

Cặp đôi bệnh và chứng được bảo tồn trong quá trình phân tích bằng việc lập bảng việc sử dụng thuốc ngừa thai trong bệnh so với sử dụng thuốc ngừa thai trong nhóm chứng. Có 10 cặp bệnh chứng trong đó cả bệnh và chứng đều dùng thuốc ngừa thai và 95 cặp đều không dùng thuốc ngừa thai. 105 cặp này không cho thông tin nào về sự liên hệ. Thông tin hoàn toàn chứa đựng trong 70 cặp mà bệnh, chứng khác nhau. Có 57 cặp bệnh chứng trong có chỉ có bệnh dùng thuốc ngừa thai trong tháng trước so với 13 cặp trong đó chỉ có chứng dùng thuốc ngừa thai trong tháng trước. Tỉ số số chênh được đo bằng tỉ số những cặp không phù hợp (discordant pairs) và bằng 4,4 (= 57/13). Kiểm định ý nghĩa thích hợp là kiểm định χ2 McNemar để so sánh tỉ lệ cặp đôi (xem Chương 14), cho χ2 = 26,4, P<0,001.

khäng bãûnh xuïc,tiãúpchæïng âoïtrong càûp Säúkhängchæïng xuïc,tiãúp bãûnhâoïtrong càûp Säú

håüp phuìkhäng càûpnhæîng säú tè OR

=

=

Nếu chọn nhiều chứng cho một bệnh, tỉ số số chênh được ước lượng bằng cách áp dụng thao tác Mantel-Haenszel. Cuối cùng, việc phân tích một số yếu tố nguy cơ, hay cần điều chỉnh các biến số gây nhiễu khác ngoài các biến số gây nhiễu đã được bắt cặp trong quy hoạch, cần một dạng hồi quy đặc biệt là hồi quy logistic có điều kiện (conditional logistic regression).

Bảng 24.5 Kết quả nghiên cứu bệnh chứng có bắt cặp số liệu để điều tra mối quan hệ giữa dùng thuốc ngừa thai (OC) và thuyên tắc mạch. Ðược phép từ Sartwell et al. (1969) American Journal of Epidemiology 90, 365-80

Chứng Dùng OC Không dùng OC Tổng số Bệnh Dùng OC 10 57 67 Không dùng OC 13 95 108 Tổng số 23 152 175

4,41357=

=OR

Page 138: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

134

Những phương pháp khác nhau được trình bày trong bảng 24.6. Thảo luận đầy đủ trong những tình huống phức tạp hơn, tham khảo Breslow và Day (1980) hay Schlesselman (1982).

Bảng 24.6 Phân tích nghiên cứu bệnh chứng - tổng kết các phương pháp

Lược đồ lấy mẫu cho

chứng

Một yếu tố nguy cơ

Nhiều yếu tố nguy cơ/điều chỉnh cho các biến số gây nhiễu

(a) một chứng cho một bệnh

Ngẫu nhiên Bảng 2×2 đơn trình bày yếu tố nguy cơ × bệnh/chứng

Kiểm định χ2 chuẩn OR=tỉ số tích chéo, ad/bc

hồi quy logistic hay phân tích phân tầng

Bắt cặp đôi Bảng 2×2 trình bày sự phù hợp giữa bệnh và chứng đối với yếu tố nguy cơ

Kiểm định χ2 McNemar

coïchæïng khäng bãûnhkhäng chæïng coï bãûnh

håüp phuìkhäng càûp säú tèOR

=

=

hồi quy logistic điều kiện

Bắt cặp tầng Phân tích phân tầng: bảng 2×2 cho mỗi tầng

Kiểm định χ2 Mantel-Haenszel

)/(

)/(

nbc

nadOR

Σ

Σ=

hồi quy logistic hay phân tích phân tầng

(b) Nhiều chứng cho một bệnh

Ngẫu nhiên Như trên như trên Một nhóm gồm nhiều bệnh và nhiều chứng của nó

Ap dụng thao tác Mantel-Haenszel đặc biệt

hồi quy logistic có điều kiện

Bắt cặp phân tầng Như trên như trên (c) Khoảng tin cậy Tất cả các lược đồ )/96,11(%95 χ±= OR

xấp xỉ dựa vào kiểm định của Mietinen

tính từ hệ số hồi quy

Khoảng tin cậy cho tỉ số số chênh

Khoảng tin cậy cho tỉ số số chênh có thể được tính giống như đối với nguy cơ tương đối, dùng phương pháp dựa vào kiểm định của Miettinen.

)/96,11(%95 χ±= OR

Có thể tính đươc khoảng tin cậy phần trăm khác bằng cách thay 1,96 với điểm phần trăm thích hợp của phân phối bình thường. Công thức này được áp dụng khi kiểm định χ2 được dùng đối với bảng 2 × 2 , kiểm định Mantel-Haenszel hay McNemar. Trong cả hai trường hợp tính căn bậc hai của χ2.

Page 139: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

NGHIÊN CỨU ÐOÀN HỆ VÀ BỆNH CHỨNG

135

Thí dụ, xét số liệu bắt cặp được trình bày trong bảng 24.5 về sự liên hệ giữa sử dụng thuốc ngừa thai và thuyên tắc mạch, trong đó:

OR = 4,4, χ2 = 26,4, P<0,001 Do có

χ = (26,4 = 5,14 và 1,96/χ = 1,96/5,14 = 0,38 Suy ra

OR (1+1,96/χ) = 4,4 (1+1,38) = 4,4 1,38 = 7,7 Và

OR (1-1,96/χ) = 4,4 (1-1,38) = 4,40,62 = 2,5 Do đó, khoảng tin cạy 95% của tỉ số số chênh là 2,5 tới 7,7.

Page 140: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

136

THỬ NGHIỆM LÂM SÀNG VÀ NGHIÊN CỨU CAN THIỆP

Giới thiệu Có 3 loại nghiên cứu thực nghiệm (thử nghiệm lâm sàng, vaccine và can thiệp) được giới thiệu ngắn gọn ở Chương 21. Các đặc điểm quy hoạch chính sẽ được mô tả ở đây. Ðể đơn giản, việc thảo luận sẽ chú trọng và thử nghiệm lâm sàng, nhưng nó cũng được áp dụng đối với thử nghiệm chế độ dự phòng và các biện pháp phòng bệnh khác. Các đặc điểm liên quan đến thử nghiệm vaccine và các can thiệp khác sẽ được xét ngắn gọn ở cuối chương. Xem Pocock (1983) để có thảo luận toàn diện về thử nghiệm lâm sàng.

Thử nghiệm lâm sàng Một thử nghiệm lâm sàng là một thử nghiệm được tiến hành để đánh giá hiệu quả của một chế độ điều trị mới. Người tình nguyện được phân vào một trong hai nhóm, nhóm điều trị (treatment group) và nhóm chứng (control group). Nhóm chứng nhận hoặc là một chế độ điều trị chuẩn của bệnh, như trong đánh giá các thuốc mới, hay không điều trị, như trong đánh giá hiệu quả của vaccine. Có thể mở rộng phương pháp bằng cho những nhóm có liều lượng thuốc khác nhau hay có những chế độ điều trị khác nhau.

Cần thiết kế sao cho sự khác biêt giữa nhóm điều trị và chứng có thể quy về tác dụng thực sự của điều trị. Nhóm ban đầu phải giống nhau càng nhiều càng tốt về tất cả các phương diện trừ phương diện trị liệu. Sẽ không hay nếu chẳng hạn như nhóm chứng ban đầu có nhiều người bị bệnh nặng hơn nhóm điều trị, bởi vì chỉ điều này không đã khiến cho trị liệu dường như có hiệu quả. Nó cách khác, phải cẩn thận tránh sai lệch chọn lựa (selection bias). Ðiều này có thể được bằng cách dùng ngẫu nhiên hóa (randomization), đôi khi được củng cố bởi bắt cặp (matched) hay quy hoạch bắt chéo (cross-over design).

Hơn nữa, phương pháp xử lí và đánh giá các nhóm phải giống nhau. Cơ hộ sai lệch trong khi tiến hành thử nghiệm có thể được giảm thiểu bằng cách dùng quy hoạch mù đơn (single blind) hay mù đôi (double-blind) và placebo.

Ngẫu nhiên hóa

Phân các người tham dự vào nhóm điều trị và nhóm chứng một cách ngẫu nhiên là một cách để tránh các sai lệch chọn lựa (cố tình hay vô ý), hoặc là bởi người nghiên cứu hoặc người tham dự, có thể dẫn đến sự khác nhau giữa hai nhóm. Có thể ngẫu nhiên hóa bằng cách dùng một bảng số ngẫu nhiên (xem Chương 23). Một chữ số được chọn với số lẻ (1,3,5,7,9) tương ứng với nhóm điều trị và số chẵn (0, 2, 4, 6, 8) tương ứng với nhóm chứng (hay ngược lại). Giả sử rằng 6 số đầu tiên được chọn là 2, 7, 9, 0, 4, 7 thì người tham dự thứ nhất sẽ ở nhóm chứng, thứ nhì và thứ ba sẽ ở nhóm điều trị, thứ tư thứ năm sẽ vào nhóm chứng và thứ sáu sẽ vào nhóm điều trị.

Ðôi khi người ta muốn phân chia sao cho chẳng hạn như cứ mỗi 10 người tham gia, số tham dự vào mỗi nhóm sẽ bằng nhau. Ðiều này đươc gọi là ngẫu nhiên hóa giới hạn (restricted randomization) hay ngẫu nhiên hóa cân bằng (randomization with balance). Trong trường hợp này việc sử dụng bảng số ngẫu nhiên sẽ khác đi. Chẳng hạn đối với mỗi 10 người tham gia, bảng được dùng để quyết định 5 người sẽ được phân vào nhóm điều trị bằng cách chọn 5 số ở giữa 01 và 10, giả sử 09, 02, 04, 01, 08 được chọn. Người thứ nhất, thứ hai, thứ tư, tứ tám và thứ chín trong nhóm sẽ được phân vào nhóm điều trị và những người khác, thứ ba, thứ năm, thứ sau, thứ bảy và thứ mười sẽ đươc phân vào nhóm đối chứng. quá trình ngẫu nhiêu hóa lại được lặp lại cho mỗi 10 người tham gia.

Có thể biến đổi để cho quá trình ngẫu nhiên hóa có thể đảm bảo tỉ lệ nam và nữ trong mỗi nhóm như nhau bằng cách dùng các số ngẫu nhiên riêng cho nam và cho nữ.

Page 141: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

THỬ NGHIỆM LÂM SÀNG VÀ NGHIÊN CỨU CAN THIỆP

137

Thứ tự sắp xếp tốt nhất phải được quyết định trước khi bắt đầu thử nghiệm. Nên cho một số các phong bì có đánh số ghi rõ sự sắp xếp đã chuẩn bị, được mở mỗi khi một người mới được chấp nhận vào thử nghiệm.

Bắt cặp

Một cách khác, quy hoạch bắt cặp đôi (matched pair design) có thể được dùng để sắp xếp cho nhóm điều trị và nhóm đối chứng tương tự với nhau về các yếu tố gây nhiễu chính, như tuổi và giới tính. Người tham gia được bắt cặp tùy theo biến số bắt cặp, và một người trong mỗi cặp đươc sắp xếp ngẫu nhiên vào nhóm điều trị và người khác đươc sắp vào nhóm chứng. Lưu ý rằng việc bắt cặp phải được tuân thủ trong khi phân tích, chẳng hạn như tiến hạnh kiểm định χ2 McNemar (xem Chương 14) chứ không phải kiểm định χ2 2 × 2 chuẩn.

Quy hoạch bắt cặp đôi không phù hợp bằng ngẫu nhiên hóa khi có sự gia nhập từ từ các người tham gia vào cuộc thử nghiệm tiến hành trong một thời gian dài bởi vì sẽ có sự trì hoãn đáng kể trước khi có thể bắt cặp cho một người mới tham gia.

Quy hoạch bắt chéo

Trong thử nghiệm lâm sàng một chế độ điều trị chỉ có ích lợi tạm thời, có thể dùng chính người tham gia để làm đối chứng. Thí dụ trong khi so sánh 2 thuốc giảm đau (A và B) để điều trị migraine, mỗi người tham gia có thể thử dùng mỗi chế phẩm trong các dịp khác nhau. Thứ tự dùng cần được ngẫu nhiên hóa để cho phân nửa người tham gia dùng thuốc A trước và phân nửa dùng thuốc B trước. Quy hoạch này được gọi là bắt chéo (Cross-over design). Khuyết điểm chính la có thể có tác động tồn dư (spill-over effect) từ lần thứ nhất ảnh hưởng đến lần thứ hai.

Quy hoạch mù đơn và mù đôi

Khi có thể, không nên để người tham gia lẫn người nghiên cứu biết loại trị liệu nào đã sử dụng cho đến cuối cuộc thử nghiệm. Ðiều này được gọi là quy hoạch mù đôi (double blind design) và đảm bảo không bị sai lệch do xử lí và đánh giá nhóm. Ðiều này đặc biệt cần thiết nếu có sự đánh giá chủ quan. Ðể đạt được điều này trị liệu cho nhóm chứng cần phải giống về bề ngoài với trị liệu của nhóm điều trị. Ðiều này có thể là sử dụng chế phẩm placebo không có tác dụng cho nhóm chứng. Chế phẩm điều trị và đối chứng chỉ được nhận biết nhờ mã số, mã số đươc giữa bởi một người không có tham gia cho đến khi thu thập tất cả các số liệu. Quy hoạch mù đơn (single blind design) là khi người nghiên cứu biết nhưng người tham gia không biết về chế độ trị liệu.

Vấn đề đạo đức

Mặc dù về mặt khoa học một thử nghiệm kiểm chứng ngẫu nhiên hóa là cách tốt nhất để xác định ích lợi của một chế độ trị liệu, việc sử dụng chúng đặt ra một vấn đề đạo đức quan trọng. Có đáng phải hoãn trị liệu có thể có ích lợi cho một nhóm đối chứng không? Ðiều này đặc biệt đúng khi một phương thức trị liệu mới được tin là không gây tác dụng phụ gì và hiện chưa có chế độ điều trị có hiệu quả hay chế độ điều trị chuẩn. Một thí dụ là việc gợi ý bổ sung vitamin trong lúc mang thai có thể giảm số mới mắc của khiếm khuyết ống thần kinh. Cũng vậy, việc nên ngẫu nhiên hóa hay để cho người tham gia có thể chọn nhóm cho họ? có cần tờ cam đoan hay không? Ðiều này được thảo luận kĩ trong hoàn cảnh của cắt bỏ khối u hay đoạn nhũ để điều trị ung thu cú của Cancer Research Campaign Working Party in Breast Conservation (1983). Ðể thảo luận đầy đủ hơn vấn đề này và những vấn đề liên quan hãy xem Bradford Hill (1977) trong đó có bản sao Khẳng định của Hội đồng nghiên cứu y khoa về trách nhiệm trong nghiên cứu đối tượng con người (Medical Research Council's Statement on Responsibility in Investigations on Human Subjects) và tuyên ngôn Helsinki (Helsinki Declaration) của Hội đồng y khoa thế giới (World Medical Assembly) về Các khuyến cáo hướng dẫn bác sĩ y khoa trong nghiên cứu y sinh có liên quan đến đối tượng con người (Reccomendations Guiding Medical Doctor in Biomedical Research Involving Human Subjects).

Page 142: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

138

Thử nghiệm lâm sàng tuần tự

Thử nghiệm lâm sàng tuần tự (sequential clinical trial) là một thử nghiệm trong đó kết quả được đánh giá liên tục để xem đã có đủ bằng chứng để ngừng thử nghiệm và tuyên bố hoặc là đã xác định được sự khác biệt hay không có sự khác biệt nào.

0

10

20

30

-20

-10

-30

2010 30 40 50 60

Antoxin täút hån coï yï nghéa(P<0,05)

Khäng duìng Antoxin täút hån coï yï nghéa(P<0,05)

Khaïc biãûtkhäng yïnghéa

Anto

xinkh

äng

Anto

xin

Læûa

choün

Hình 25.1 Kết quả từ một thử nghiệm tuần tự để đánh giá giá trị của liều cao kháng độc tố trong điều trị uốn ván lâm sang. Với sự cho phép của Brown et al. (1960) Lancet ii, 227-230 Thử nghiệm tuần tự thường được dùng khi kết cuộc của đo lường là một tỉ lệ, thí dụ như tỉ lệ sống còn trong mỗi nhóm điều trị. Phương pháp luận được minh họa bằng một thí dụ đặc hiệu (xem chi tiết ở Armitage, 1975). Hình 25.1 trình bày kết quả của một thử nghiệm để đánh giá hiệu quả của liều lượng cao kháng độc tố trong điều trị uốn ván lâm sàng bằng cách so sánh tỉ lệ tử vong giữa những người được và không được cho kháng độc tố. Người tham gia được chia làm 2 nhóm, một người được nhận kháng độc tố và một người không. Nếu người nhận kháng độc đố còn sống trong khi người kia chết sẽ có thiên vị thuận lợi cho kháng độc tố. Ngược lại nếu người nhận kháng độc tố chết còn người kia sống sẽ có thiên vị thuận lợi cho không sử dụng kháng độc tố. Nếu cả hai thành viên đều sống hay đều chết, đây là một cặp phù hợp và không góp thêm thông tin gì cho việc so sánh dùng kháng độc tố với không dùng kháng độc tố.

Kết quả đươc ghi nhận được trên một đồ thị trình bày số dư của thiên vị và số các cặp không phù hợp. Ðồ thị bắt đầu ở điểm zero và vẽ lên một đơn vị và qua phải cho mỗi thiên vị thuận lợi cho kháng độc tố và xuống một đơn vị và qua phải cho mỗi thiên vị thuận lợi cho không dùng kháng độc tố. Ranh giới trên được vẽ để trình bày ý nghĩa ở mức 5% và xác suất đường này hay đường kia bị cắt là 95% nếu tỉ suất của số dư thiên vị là 75% hay hơn. Ở giữa đường hình cái nêm thể hiện không có ý nghĩa. Ranh giới trên bị cắt ở thiên vị thứ 18 và thử nghiệm kết thúc. 15 cặp cho kết quả sống còn thuận lợi cho kháng độc tố và 3 cặp thuận lợi cho không dùng kháng độc tố, do đó xác định sự giảm tử vong có ý nghĩa trong nhóm được cho kháng độc tố (P<0,05).

Page 143: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

THỬ NGHIỆM LÂM SÀNG VÀ NGHIÊN CỨU CAN THIỆP

139

Ưu điểm chính của thử nghiệm lâm sàng tuần tự là nói chung cần ít người tham gia để có được kết luận hơn một thử nghiệm có kích thước cố định, trong đó phân tích được tiến hành một lần lúc hoàn tất. Dù vậy điều này bù trừ bởi mức ý nghĩa bị giảm bởi vì người ta đã điều chỉnh cho sự gia tăng khả năng có kết quả ý nghĩa do các kiểm định được lập lại. Do đó, trong thí dụ trên, mức ý nghĩa thu được là 5%. Nếu không có điều chỉnh này, kiểm định McNemar cho giá trị χ2 là 6,7 khi so sánh 15 cặp thuận lợi với kháng độc tố và chỉ 3 cặp thuận lợi cho việc không dùng kháng độc tố. Nó có mức ý nghĩa 1%. Ðiều cần xét về mặt thực tiễn là thử nghiệm tuần tự không thích hợp cho các tình huống mà có một khoảng thời gian dài giữa trị liệu và đánh giá cuối cùng của đáp ứng.

Thử nghiệm vaccine Vấn đề quy hoạch thử nghiệm vaccine tương tự với thử nghiệm lâm sàng thuốc (và các biện pháp điều trị) và nên sử dụng quy hoạch đối chứng ngẫu nhiên hóa. Dù vậy, mục tiêu của thử nghiệm vaccine hoàn toàn khác. Chủng vaccine là một biện pháp phòng bệnh và vaccine và placebo được dùng cho người khỏe mạnh chứ khôngphải cho người bệnh. Mục tiêu là đánh giá hiệu lực (efficacy) của chủng vaccin trong việc phòng ngừa sự xuất hiện bệnh. Ðiều này được đo lường bằng tỉ lệ các trường hợp bệnh trong nhóm placebo mà lẽ ra không xảy ra nếu họ được chủng vaccine.

Thí dụ hãy xét bảng 25.1 trong đó trình bày kết quả từ một thử nghiệm một vaccince cúm mới. Tổng số 80 trường hợp cúm xảy ra trong nhóm placebo. Nếu nhóm này được chủng vaccin người ta kì vọng chỉ 8,3% (tỉ suất trong nhóm chủng vaccine) trong số đó bị cúm bằng 220 × 0,083 = 18,3. Sẽ cứu được 80 - 18,3 = 61,7 trường hợp, tính ra kết quả của vaccine là 61,7/80 = 77%

Bảng 25.1 Kết quả của thử nghiệm vaccine cúm, đã được trình bày trong bảng 13.1

Cúm vaccine placebo tổng số Có 20(8,3%) 80(36,4%) 100(21,7%) Không 220 140 360 Tổng số 240 220 460

Có thể đơn giản hóa tính toán thành công thức sau, cho thấy rõ mối liên kết giữa hiệu lực vaccine và nguy cơ tương đối liên hệ do không sử dụng vaccine.

chuíng tiãmkhäng nhoïmtrong màõc måïi suáút tèchuíng tiãm nhoïmtrong màõc måïi suáút tèvaccine læûc Hiãûu

−=1)(VE

Công thức này cũng được dùng để tính độ tin cậy của thử nghiệm vaccine. Trước hết tính khoảng tin cậy của nguy cơ tương đối như trong Chương 24. Sau đó thay vào công thức trên để có giới hạn tương ứng của hiệu lực vaccine.

χ/96,11

11).(.%95 ±−=RR

VEic

Trong thí dụ này

trãn) nhæ(giäúng 77,036,41111;36,4

240/20220/80 =−=−===

RRVERR

χ2 = 51,37 và χ = (51,37 = 7,17 Giới hạn tin cậy dưới

RR1-1,96/7,17 = 4,361-0,27 = 4,360,73 = 2,93

Page 144: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

140

VE tương ứng = 1 - 1/2,93 = 0,66 Giới hạn tin cậy trên

RR1+1,96/7,17 = 4,361+0,27 = 4,361,27 = 6,49 VE tương ứng = 1 - 1/6,49 = 0,85

Do đó khoảng tin cậy 95% của hiệu lực vaccine của vaccine cúm này là 66% tới 85%.

Nghiên cứu can thiệp Thử nghiệm can thiệp là một loại nghiên cứu thực nghiệm khác. Quy hoạch cơ bản của nó tương tự như thử nghiệm lâm sàng chỉ trừ một ngoại lệ. Việc áp dụng của can thiệp thường được áp dụng vào một cộng đồng chứ không phải cho các cá nhân. Thí dụ là đánh giá tác động bổ sung flourur vào nước uống lên bệnh sâu răng ở một số quận này mà không có ở quận khác, và việc đánh giá tác động lên số mới mắc tiêu chảy của một nguồn nước cải thiện. Các vấn đề mà một thử nghiệm dựa trên cộng đồng đặt ra còn là một lãnh vực bị bỏ quên và ngoài phạm vi của cuốn sách này (xem Smith, 1987).

Page 145: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

TÍNH CỠ MẪU CẦN THIẾT

141

TÍNH CỠ MẪU CẦN THIẾT

Giới thiệu Phần quan trọng trong lập kế hoạch điều tra là quyết định có bao nhiều người cần được nghiên cứu để trả lời mục tiêu nghiên cứu. Rất nhiều khi người ta quyết định dựa trên lãnh vực hậu cần đơn thuần. Ðó là thói quen xấu và nhiều người xem đó là không đạo đức. Mặt khác nghiên cứu nhiều người hơn cần thiết là sự lãng phí thời gian, tiền bạc và tài nguyên (thường là giới hạn). Trong thử nghiệm lâm sàng điều ngày không chỉ là nhiều người hơn cần thiết phải sử dụng placebo mà còn có nghĩa là làm trì trệ việc đưa vào sử dụng trị liệu có ích. Mặt khác tham gia một nghiên cứu quá nhỏ không trả lời được mục tiêu cũng đáng chê trách không kém.

Dù vậy, tính toán cỡ mẫu cần thiết không phải là một thao tác đơn giản bởi vì trước hết cần phải định lượng hóa mục tiêu. Thí dụ, không thể chỉ khẳng định đơn thuần rằng mục tiêu là xác đính có phải trẻ nuôi bằng bình có nguy cơ tử vong cao hơn trẻ nuôi bằng sữa mẹ hay không. Nó cũng cần khẳng định độ lớn của nguy cơ gia tăng muốn xác định bởi vì để phát hiện sự gia tăng gấp 4 lần cần cỡ mẫu nhỏ hơn khi muốn phát hiện sự gia tăng gấp 2 lần. Hơn nữa, ngay cả khi cỡ mẫu gia tăng, bởi vì sự biến thiên lấy mẫu (xem Chương 3), luôn luôn có khả năng chỉ quan sát được nguy cơ nhỏ hơn rất nhiều và chúng ta không thể đảm bảo rằng nghiên cứu cho kết quả ý nghĩa. Chúng ta có thể làm gì để định rõ xác suất mà chúng ta muốn đạt được một ý nghĩa thống kê nhất định. Xác suất này gọi là năng lực (power) của nghiên cứu. Do đó chúng ta có thể xác định rằng nghiên cứu sẽ xứng đáng nếu có xác suất 90% khẳng định được sự khác biệt trong nguy cơ giữa nhóm trẻ bú bình và bú mẹ nếu nguy cơ tương đối thực sự là 2.

Nguyên lí của việc xác định cỡ mẫu Trong chương 12 chúng ta đã thảo luận việc phân tích kết quả của thử nghiệm lâm sàng để so sánh 2 loại thuốc giảm đau, trong đó 9 trong số 12 người bị migraine nói rằng họ giảm nhiều với thuốc A hơn thuốc B. Dù vậy, tỉ lệ vượt trội 0,75 thuận lợi cho thuốc A không có ý nghĩa (P=0,15), cho thấy rằng kết quả phù hợp giới giả thuyết trung tính là không có sự khác biệt về hiệu quả giữa hai loại thuốc. Có thể xảy ra một trong hai điều hoặc là thực sự không có sự khác biệt giữa các loại thuốc hoặc là thuốc A tốt hơn nhưng cỡ mẫu 12 không đủ lớn để cho thấy điều đó.

Xét quy hoạch một nghiên cứu như vậy, và chúng ta cần bao nhiêu bệnh nhân để có thể xác định tính chất ưu việt của thuốc A. Ðầu tiên chúng ta phải đặc hiệu hóa ưu việt hơn nghĩa là gì. Chúng ta bắt đầu bằng cách khẳng định điều này là tỉ lệ thiên lệch 70% hay hơn về thuốc A và chúng ta quyết định chúng ta muốn năng lực 90% đạt được mức ý nghĩa 5%.

Page 146: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

142

0 0.5 0.7 1

0.28 0.72

(a) n=20

KHÄNG YÏ NGHÉA COÏ YÏ NGHÉA

0 0.5 0.7 1

0.36 0.64

(a) n=50

KHÄNG YÏ NGHÉA COÏ YÏ NGHÉA

0 0.5 0.7 1

(a) n=62

KHÄNG YÏ NGHÉA COÏ YÏ NGHÉA

Xaïc suáút coï kãút quaí yïnghéa =42,1%

Xaïc suáút coï kãút quaí yïnghéa tàng lãn 82,4%

Xaïc suáút coï kãút quaí yïnghéa âaût 90%

Tè lãû coï kãút quaí täút âäúi våïi thuäúc A

Hình 26.1 Xác suất đạt được ý nghĩa (ở mức 5%) với các cỡ mẫu khác nhau (n) khi kiểm định tỉ lệ thiên vị thuốc A hơn thuốc B khác giá trị giả thuyết trung tính là 0,5, nếu giá trị thực là 0,7

Nguyên lí của việc xác định cỡ mẫu được giới thiệu tốt nhát bằng cách xem xét các cỡ mẫu khác nhau và đánh giá chúng có thỏa mãn yêu cầu của chúng ta hay không. Chúng ta sẽ bắt đầu với cỡ mẫu 20, được mô tả trong hình 26.1 (a). Nhớ lại rằng, kết quả có mức ý nghĩa 5% nếu nó cách trung bình 1,96 s.e. Hay hơn, và giá trị của giả thuyết trung tính về tỉ lệ thiên lệch với thuốc A là 0,5 và sai số chuẩn (s.e.) bằng √(0,5 × 0,5/n). Ðiều này có nghĩa là cỡ mẫu bằng 20?

28,01118,096,15,0..96,15,072,01118,096,15,0..96,15,0

1118,020/5,05,0..

=×−=+=×+=+

=×=

eseses

vaì

Do đó phạm vi giá trị có kết quả ý nghĩa là trên hoặc bằng 0,72 và dưới hoặc bằng 0,28.

Nếu tỉ lệ thực sự là 0,7, khả năng quan sát được tỉ lệ bằng hoặc lớn hơn 0,72 và cho kết quả có ý nghĩa là bao nhiêu? Khả năng này được minh họa bởi hình gạch chéo trên hình. Ðường cong thể hiện phân phối lấy mẫu, đó là phân phối bình thường có sai số chuẩn là (0,7 × 0,3/20) = 0,1025. Giá trị z tương ứng với 0,72 là:

Page 147: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

TÍNH CỠ MẪU CẦN THIẾT

143

20,01025,0

7,072,0 =−

Tỉ lệ của phân phối bình thường lớn hơn 0,20 đươc tìm thấy trong bảng A1 bằng 0,421 hay 42,1%. Do đó, nói tóm lại điều này có nghĩa là với cỡ mẫu 20 ta chỉ có 41,2% cơ hội xác định được thuốc A tối hơn nếu tỉ lệ thiên vị thực sự là 0,7.

Sau đó chúng ta hãy xem chuyện gì xảy ra nếu ta tăng cỡ mẫu lên 50, như trình bày trong hình 26.1(b). Phạm vi của giá trị mở rộng đến từ 0,64 lên trên và từ 0,36 xuống dưới. Phân phối lấy mẫu đã hẹp lại và vùng trùng lắp với phạm vi ý nghĩa lớn hơn. Do đó xác suất có kết quả ý nghĩa đã tăng lên bằng 82,5% nhưng chưa đạt đến yêu cầu của chúng ta là 90%.

Do đó chúng ta nhất định sẽ cần phải hơn 50 bệnh nhân để có năng lực 90%. Nhưng chúng ta cần bao nhiêu? Chúng ta càn tăng cỡ mẫu tới n, ở đó vùng trùng lắp giữa phân phối lấy mẫu và phạm vi ý nghĩa đạt được 90% như trình bày trong hình 26.1(c). Chúng ta sẽ mô tả cách làm thế nào để tính trực tiếp cỡ mẫu cần thiết. Ðạt được kết quả có ý nghĩa nếu chúng ta quan sát được giá trị lớn hơn

0,5 + 1,96 s.e. = 0,5 + 1,96 × √(0,5 × 0,5/n) (hay dưới 0,5 - 1,96 s.e.). Chúng ta muốn chọn n đủ lớn để 90% phân phối lấy mẫu ở trên điểm này. Giá trị z của phân phối lấy mẫu tương ứng với 90% là - 1,28 (xem bảng A2), có nghĩa là một giá trị quan sát

0,7 - 1,28 s.e. = 0,7 - 1,28 × √(0,7 × 0,3/n) Do đó n được chọn đủ lớn để

0,7 - 1,28 × √(0,7 × 0,3/n) > 0,5 + 1,96 × √(0,5 × 0,5/n) Chuyển vế ta được

n3,07,028,15,05,096,15,07,0 ××+××>−

Bình phương hai vế và chuyển vế ta được

4,612,0

5666,12,0

]3,07,028,15,05,096,1[

2

2

2

2

==

××+××>n

Do đó chúng ta cần khoảng 60 bệnh nhân để thỏa mãn yêu cầu của chúng ta là có năng lực 90% xác định sự khác biệt có ý nghĩa giữa thuốc A và thuốc B ở mức 5%, nếu sự thiên lệch thực sự cho thuốc A là 0,7.

Công thức tính cỡ mẫu Thảo luận ở trên lênquan đến việc xác định cỡ mẫu cho phép kiểm định một tỉ lệ đơn, đó là tỉ lệ người tham dự thiên lệch thuốc A so với thuốc B. Trên thực tiễn không nhất thiết lúc nào cũng phải lí luận chi tiết như vậy. Cỡ mẫu có thể tính trực tiếp từ công thức tổng quát, dùng cho kiểm định ý nghĩa một tỉ lệ đơn là

Page 148: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

144

{ }2

0

2

00

)()1()1(

ππππππ

−−+−

>vu

n

Trong đó

n = cỡ mẫu cần thiết p = tỉ lệ quan tâm po = tỉ lệ của giả thuyết trung tính u = điểm phần trăm một đuôi của phân phối bình thường tương ứng với 100% -

năng lực, thí dụ nếu năng lực là 90%, (100% - năng lực) = 10% và u = 1,28

v = điểm phần trăm hai đuôi của phân phối bình thường tương ứng mức ý nghĩa cần thiết, thí dụ nếu mức ý nghĩa là 5%, v= 1,96

Áp dụng công thức này cho thí dụ trên ta có:

p = 0,7 po = 0,5 u = 1,28 và v = 1,96 Suy ra

4,612,0

5666,1)5,07,0(

]5,05,096,13,07,028,1[

2

2

2

2

==

−×+×>n

Cũng đúng bằng kết quả thu được ở trên.

Cũng có thể áp dụng các nguyên lí tương tự cho các trường hợp khác. Ở đây chúng ta không lí luận chi tiết nhưng sẽ trình bày các công thức dùng cho các tình huống phổ biến nhất trong bảng 26.1. Danh sách gồm 2 phần. Bảng 26.1(a) gồm các trường hợp mà mục đích nghiên cứu là xác định sự khác biệt có ý nghĩa. Bảng 26.1(b) gồm các tình huống ước lượng một con số quan tâm với độ chính xác nhất định. Lưu ý rằng trong trường hợp có hai trung bình, hai tỉ lệ hay hai tỉ suất công thức cho cỡ mẫu cần thiết cho một trong hai nhóm. Do đó tổng số cỡ mẫu cần thiết cho nghiên cứu gấp đôi số này. Bảng 26.2 trình bày các hệ số điều chỉnh cho việc quy hoạch nghiên cứu có các nhóm không cùng cỡ (xem thí dụ 26.3). Lưu ý rằng trong công thức áp dụng cho tỉ suất cỡ mẫu có cùng đơn vị với tỉ suất (xem thí dụ 26.2)

Việc sử dụng bảng sẽ được minh họa qua một số ví dụ. Cần nhận thức rằng việc tính toán cỡ mẫu chỉ dựa trên sự suy đoán tốt nhất của chúng ta về tình hình. Con số không phải là con số ảo thuật. Nó chỉ cho một ý niệm về độ lớn của số người cần được nghiên cứu. Nói cách khác, nó hữu dụng khi cần phân biệt giữa 50 và 100 chứ không phải để phân biệt giữa 51 và 52. Vì lí do này, các hiệu chỉnh liên tục không được đưa vào công thức liên quan đến tỉ lệ, bởi vì nó đươc coi như sự phức tạp không cần thiết. Hơn nữa, các suy đoán của chúng ta khó có thể chính xác, bởi vì nếu chúng ta đã biết câu trả lời chúng ta đã chẳng cần làm nghiên cứu. Do đó cần tiến hành tính cỡ mẫu cho một số hoàn cảnh chứ không phải chỉ trong một hoàn cảnh. Như vậy sẽ có một hình ảnh rõ ràng về phạm vi có thể của cuộc nghiên cứu và rất hữu ích trong việc cân đối giữa cái mong muốn và tính khả thi về hậu cần.

Cuối cùng, cỡ mẫu phải tăng để bù trừ cho những người không đáp ứng và bỏ cuộc. Cũng cần điều chỉnh khi sử dụng lược đồ lấy mẫu cụm chứ không phải lấy mẫu ngẫu nhiên, và cần thiết kiểm soát yếu tố gây nhiễu trong phân tích. Ðiều này không chỉ ngoài phạm vi cuốn sách mà còn là một lĩnh vực chưa mấy phát triển.

Thí dụ 26.1

Một nghiên cứu được tiến hành trong một vùng nông thôn ở Ðông Phi để xem việc bổ sung thức ăn trong lúc mang thai có làm tăng trọng lượng trẻ sinh ra hay không. Phụ nữ khám tiền

Page 149: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

TÍNH CỠ MẪU CẦN THIẾT

145

sản được phân ngẫu nhiên thành có nhận thức ăn bổ sung và không nhận thức ăn bổ sung. Công thức 4 trong bản 26.1 sẽ giúp chúng ta quyết định cần huy động bao nhiêu phụ nữ trong mỗi nhóm. Chúng ta cần cung cấp những thông tin sau:

(a) độ lớn của sự khác nhau về cân nặng mà chúng ta muốn phát hiện. chúng ta quyết định rằng sự gia tăng 0,25 kg là tác động đáng kể mà chúng ta không muốn bỏ qua. Do đo chúng ta áp dụng công thức này với µ1-µ2 = 0,25 kg.

Page 150: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

146

Bảng 26.1 Công thức xác định cỡ mẫu (a) cho các nghiên cứu xác định sự khác biệt có ý nghĩa (b) cho các nghiên cứu nhằm ước lượng một chỉ số quan tâm với độ chính xác nhất định

Thông tin cần thiết Công thức tính cỡ mẫu tối thiểu (a) Kết quả ý nghĩa 1. Trung bình đơn

µ-µ0 σ u,v

Sự khác biệt giữa trung bình, µ với giá trị giả thuyết trung tính Ðộ lệch chuẩn Xem ở dưới

221

eµµ +

2. Tỉ suất đơn* µ µ0 u,v

Tỉ suất Giá trị giả thuyết trung tính Xem ở dưới

20

2

)(

)(

µµ

µ

+ vu

3. Tỉ lệ đơn π π0 u,v

Tỉ lệ Giá trị giả thuyết trung tính Xem ở dưới

{ }2)0(

2)

01(

0)1(

ππ

ππππ

−+− vu

4. So sánh hai trung bình (cỡ mẫu cho mỗi nhóm)

µ1 - µ2 σ1, σ2 u, v

Hiệu số hai trung bình Ðộ lệch chuẩn Xem ở dưới 2

21

)(2

)(

)( 2

2

2

1

µµ

σσ

+ +vu

5. So sánh hai tỉ suất* (cỡ mẫu cho mỗi nhóm)

µ1,µ2 u, v

Tỉ suất Xem ở dưới 2

21 )(

)21

(2)(

µµ

µµ

++ vu

6. So sánh hai tỉ lệ (cỡ mẫu cho mỗi nhóm)

π1, π2 u, v

Tỉ lệ Xem ở dưới { }

2)12(

2)1(2)

21(

2)1

1(1

ππ

ππππππ

−+−+− vu

7. Nghiên cứu bệnh chứng (cỡ mẫu cho mỗi nhóm)

π1 OR π2

Tỉ lệ nhóm chứng tiếp xúc Tỉ số số chênh Tỉ lệ nhóm bệnh tiếp xúc )1(11

12 −+

=OR

OR

π

ππ

Tất cả các trường hợp u, v

u v

Xem ở dưới Ðiểm phần trăm một đuôi của phân phối bình thường tương ứng với 100%-năng lực, td. nếu năng lực = 90%, u = 1,28 Ðiểm phần trăm của phân phối bình thường tương ứng với mức ý nghĩa, td. nếu mức ý nghĩa = 5%, v = 1,96

(b) Ðộ chính xác

8. Trung bình đơn σ e

Ðộ lệch chuẩn Ðộ lớn sai số chuẩn cần thiết 2

2

9. Tỉ suất đơn* µ

e Tỉ suất Ðộ lớn sai số chuẩn cần thiết 2e

µ

10. Tỉ lệ đơn π e

Tỉ lệ Ðộ lớn sai số chuẩn cần thiết 2

)1(e

ππ −

11. Hiệu số giữa hai trung bình (cỡ mẫu cho mỗi nhóm)

σ1, σ2 e

Ðộ lệch chuẩn Ðộ lớn sai số chuẩn cần thiết 2

22

21

eσσ +

12. Hiệu số giữa hai tỉ suất* (cỡ mẫu cho mỗi nhóm)

µ1, µ2 e

Tỉ suất Ðộ lớn sai số chuẩn cần thiết 2

21

eµµ +

11. Hiệu số giữa hai tỉ lệ (cỡ mẫu cho mỗi nhóm)

π1, π2 e

Tỉ lệ Ðộ lớn sai số chuẩn cần thiết

π1(1-π1)+π2(1-π2) ---------------

e2

* Trong các trường hợp này, cỡ mẫu có cùng đơn vị với mẫu số của tỉ suất. Thí dụ nếu tỉ suất tính theo người năm thì công thức tính ra người năm quan sát (xem thí dụ 26.2)

Page 151: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

TÍNH CỠ MẪU CẦN THIẾT

147

(b) Ðộ lệch chuẩn của phân phối trọng lượng lúc sinh trong mỗi nhóm. Chúng ta quyết định giả sử rằng độ lệch chuẩn của trọng lượng lúc sinh sẽ như nhau trong hai nhóm. Số liệu cũ gợi ý rằng độ lệch chuẩn là 0,4 kg. Nó cách khác chúng ta giả sử rằng s1 = 0,4 kg và s2 = 0,4 kg.

(c) Thống nhất năng lực cần thiết là 95%. Do đó chúng ta cần u 1,64

(d) Mức ý nghĩa cần thiết. Chúng ta quyết định rằng nếu có thể chúng ta sẽ đạt được mức ý nghĩa 1%. Do đó v = 2,58. Áp dụng công thức 4 với các giá trị này ta đạt được

2,910625,0

32,08084,1725,0

)4,04,0()58,264,1(2

222

=×=

+×+>n

Do để thỏa mãn yêu cầu của chúng ta chúng ta cần huy động khoảng 90 người phụ nữ trong mỗi nhóm.

Thí dụ 26.2

Trước khi tham gia vào một can thiệp cung cấp nước, thanh khiết và vệ sinh ở nam Bangladesh, đầu tiên chúng ta muốn biết số lần tiêu chỷa hằng năm của trẻ dưới 5 tuổi. Chúng ta giả sử tỉ suất mới mắc là 3 nhưng muốn ước lượng chúng với sai số (0,2. Ðiều này có nghĩa là, nếu chúng ta quan sát được 2,6 lần tiêu chảy/trẻ/năm chúng ta có thể kết luận rằng tỉ suất thực sự có lẽ ở giữa 2,4 và 2,8 lần/trẻ/năm. Viết lại điều này bằng từ ngữ thống kê, chúng ta muốn rằng khoảng tin cậy 95% không rộng hơn (0,2. Bởi vì độ rộng của khoảng tin cậy này khoảng (2 s.e.. Ðiều này có nghĩa là chúng ta muốn nghiên cứu đủ trẻ để có sai số chuẩn nhỏ hơn 0,1 lần/trẻ/năm. Áp dụng công thức 9 và bảng 26.1 tính ra được

3001,03

2 =>n

Lưu ý rằng công thức này áp dụng cho tỉ suất (số 3, 6, 11, 14) cho số mẫu cần thiết có đơn vị giống như tỉ suất. Chúng ta tính tỉ suất theo số lần cho mỗi trẻ cho mỗi năm. Do đó chúng ta cần nghiên cứu 300 trẻ năm để có độ chính xác mong muốn. Ðiều này có thể đạt được bằng cách quan sát 300 trẻ trong một năm hay quan sát 1200 trẻ trong 3 tháng. Dù vậy không nên bỏ qua các khả năng khác như tác động của thời tiết khi quyết định khoảng thời gian của nghiên cứu.

Thí dụ 26.3

Một nghiên cứu bệnh chứng để nghiên cứu xem trẻ bú bình có nguy cơ chết vì nhiễm trùng hô hấp cấp tính có cao so với trẻ bú mẹ hay không. Mẹ ở một nhóm bệnh (trẻ chết với giấy chứng tử có nguyên nhân chết là hô hấp sẽ được phỏng vấn về tình trạng bú sữa mẹ của trẻ trước khi chết. Kết quả được so sánh với số liệu thu được về tình trạng bú sữa mẹ từ mẹ của những đứa trẻ chứng bình thường. Người ta kì vọng khoảng 40% chứng (p1 = 0,4) sẽ bú bình và chúng ta muốn phát hiện sự khác biêt nếu bú bình liên quan đến sự gia tăng nguy cơ tử vong gấp 2 (OR =2). Cần nghiên cứu bao nhiêu bệnh và chứng để có năng lực 90% (u = 1,28) đạt đươc mức ý nghĩa 5% (v=1,96)? việc tính toán gồm một số bước chi tiết trong công thức 7 của bảng 26.1.

Page 152: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

148

(a) Tính p2, tỉ lệ của trẻ bú bình

57,04,18,0

)12(4,0124,0

)1(1 1

12 ==

−×+×=

−+=

OROR

πππ

(b) Tính (p, trung bình của p1 và p2

(c) Tính cỡ mẫu tối thiểu

4,17917,0

2769,217,0

4996,096,14851,028,1[

)4,057,0(]515,0485,0296,143,057,06,04,028,1[

2

2

2

2

2

==×+×=

−××+×+×>n

Do đó chúng ta cần huy động khoảng 1 bệnh và 180 chứng để có tổng số cỡ mẫu là 360. Chuyện gì sẽ xảy ra nếu chúng ta quyết định huy động số chứng lớn gấp 3 lần số bệnh. Bảng 26.2 trình bày các hệ số điều chỉnh cho số các bênh tùy theo số các chứng/bệnh khác nhau. Thí dụ c = 3, hệ số điều chỉnh là 2/3. Ðiều này có nghĩa là chúng ta cần 180 × 2/3 = 120 bệnh và số chứng nhiều gấp 3 lần = 360. Mặc dù số chứng cần thiết đã giảm đáng kể, cỡ mẫu chung đã tăng từ 360 lên 540.

Bảng 26.2 Hệ số điều chỉnh để sử dụng trong quy hoạch nghiên cứu đ so sánh các nhóm có kích thước không bằng nhau, như việc chọn nhiều chứng cho một bệnh trong nghiên cứu bệnh chứng. Hệ số (f) ap dụng cho nhóm nhỏ hơn và bằng (c+1)/2c, trong đó kích thước của nhóm lớn hơn sẽ bằng c lần kích thước của nhóm nhỏ. Cỡ mẫu của nhóm nhỏ sẽ là fn trong đó n là số cần thiết trong trường hợp 2 nhóm bằng nhau và cỡ mẫu của nhóm lớn sẽ là cfn (xem thí dụ 26.3)

Tỉ số của nhóm lớn so với nhóm nhỏ (c)

Ðiều chỉnh cỡ mẫu của nhóm nhỏ (f)

1 1 2 3/4 3 2/3 4 5/8 5 3/5 6 7/12 7 4/7 8 9/16 9 5/9 10 11/12

485,02

57,04,0 =+=π

Page 153: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

SỬ DỤNG MÁY TÍNH

149

SỬ DỤNG MÁY TÍNH

Giới thiệu Trong thập kỉ qua đã diễn ra cuộc cách mạng trong sự tiếp cận với công nghệ máy tính. Mười lăm năm trước, rất ít người có thể có được thậm chí một máy tính cầm tay và đa số các máy tính cầm tay đều có thành tích tầm thường, chỉ làm các phép tính số học cơ bản. Máy tính là các máy lớn cần một môi trường được điều hòa không khí và một số người điều hành chúng. Chúng được sử dụng giới hạn trong các nhà phân tích viên máy tính và các lập trình viên. Sự phát triển của máy vi tính đã làm thay đổi tất cả. Với một chi phí tương đối thấp, có thể mưa cho mình một hệ thống máy tính đặt vừa trên một chiếc bàn và thỏa mãn hầu hết các nhu cầu tính toán và học được (ngay cả khi trước đó không có kinh nghiệm về máy tính) các kĩ năng về tính toán trong thời gian tương đối ngắn.

Chỉ trừ các nghiên cứu rất nhỏ, hầu hết các nghiên cứu đều có ích khi sử dụng máy tính. Nó tính toán nhanh hơn và chính xác hơn khi tính bằng tay. Có thể xử lí số liệu lớn và phân tích phức tạp hơn. Nó cũng cho phép dễ dàng lập lại các phân tích có thay đổi, chẳng hạn như phân tích nam và nữ riêng và chung. Dù vậy cần phải lưu ý một số điều. Việc sử dụng máy tính đòi hỏi thêm thì giờ để chuẩn bị số liệu và chương trình. Cần phải kiểm tra tất cả các thủ tục trên một số nhỏ các số liệu và kiểm chứng kết quả bằng tay. Nếu không có thể xảy ra các sai sót nghiêm trọng. Cuối cùng, có thể đi rất ra và làm rất nhiều các phân tích mà không có suy nghĩ thực sự về chúng.

Chúng ta sẽ mô tả ngắn gọn các phương tiện căn bản cho bất kì các hệ thống máy tính nào và xác định các hạn chế phổ biến. Bởi vì công nghệ máy tính phát triển rất nhanh, chúng tôi không khuyến cáo nhất định về loại thiết bị cần thiết, và danh sách cũng không toàn diện. Ðể nắm thêm chi tiết cần một cuốn sách chuyên ngành cập nhật hay một cuốn sách hướng dẫn cho người mua máy tính.

Phần cứng máy tính Thiết bị máy tính được gọi là phần cứng (hardware). Một máy vi tính điển hình gồm có một bàn phím, một màn hình (monitor), một bộ vi xử lí có bộ nhớ (bộ nhớ truy cập ngẫu nhiên - Random access memory - RAM), và các ổ đĩa. Nó thường được kèm theo máy in.

Một máy tính lớn (mainframe) có bộ xử lí mạnh hơn, có hê thống chia xẻ thời gian giải quyết với nhiều người dùng cùng một lúc. Nó có hệ điều hành tinh vi hơn và có khả năng lưu trữ lớn hơn. Số liệu có thể ở trên đĩa cứng để dễ dàng và nhanh chóng truy suất trong khi phân tích hay trên các băng từ để lưu trữ số lượng lớn trong thời gian lâu dài. Dung lượng của băng từ phụ thuộc vào chiều dài, mật độ và dạng thức. Thí dụ, một băng từ dài 2400 feet được viết với mật độ 1600 b.p.i. (bits per inch) có thể giữ khoảng 30 triệu kí tự thông tin. Nếu nó chứa một bản vấn lục dài 120 biến số, có tổng số 300 chữ số, băng từ sẽ có thể giữ khoảng 100.000 bản vấn lục.

Ổ đĩa Có hai loại ổ đĩa, đĩa mềm và đĩa cứng. Ổ đĩa mềm có thể tiếp nhận đĩa mềm có kích thước khác nhau (thí dụ 3,5 inch, 5,25 inch) phụ thuộc vào máy cụ thể. Dung lượng của đĩa (và của bộ nhớ trong) được tính bằng byte, trong đó một byte là số không gian cần thiết để chứa đựng một kí tự. Khả năng của đĩa phụ thuộc vào dạng thực của hệ thống sử dụng để sắp xếp số liệu trên đĩa, thông tin được lưu trữ mật độ đơn hay mật độ đôi, và đĩa có thể đọc một mặt hay hai mặt. Chữ k kí hiệu 100 và mega có nghĩa là một triệu. Do đó một đĩa mềm có dung lượng 1,44 megabyte có thể chứa được 1.400.000 kí tự.

Ðĩa cứng thường có dạng cố định, nằm ở bên trong máy tính. Nó có dung lượng lớn chẳng hạn như 120 hay 210 megabyte, truy suất đọc và ghi rất nhanh.

Page 154: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

150

Tổ chức dữ liệu Số liệu được lưu trữ dưới dạng tập tin (file), và được tập hợp trong thư mục (directory) của đĩa. Một tập tin có những mẫu tin (records). Có thể có một hay nhiều mẫu tin cho một cá nhân chẳng hạn tương ứng với số trang khác nhau của bản vấn lục. Tập tin có thể có cấu trúc tuần tự hay truy cập ngẫu nhiên. Trong tập tin tuần tự (sequential file) các mẫu tin được viết và đọc theo thứ tự. Thí dụ, để truy cập thông tin có liên quan đến người số 10, đầu tiên cần đọc thông tin từ người số 1 đến 9. Tập tin truy cập ngẫu nhiên (random access file) có thể đi thẳng đến vị trí của mẫu tin số 10 để đọc (hay ghi) thông tin cho người số 10.

Các mẫu tin đươc viết dưới dạng thức cố định hay tự do. Trong dạng thức cố định (fixed format), số liệu được sắp xếp theo chuỗi các số (hay kí tự), và một biến luôn luôn ở cùng một vị trí cột trong mẫu tin. Số được căn phải (right justified). Thí dụ, nếu hai vị trí được phân cho tuổi, thì 9 tuổi sẽ được lưu trữ bằng 09 hay 9 chứ không phải là 9 . Dấu thập phân không được ghi rõ; vị trí của nó được rút ra từ số cột. Trong dạng thức tự do (free format), biến số được sắp xếp theo mẫu tin, cách nhau bởi dấu phảy hay khoảng trắng, không cố ý xếp hàng theo mẫu tin. Phải ghi các số thập phân. Một thí dụ của hai loại dạng thức trên được trình bày trong bảng 27.1

Cuối cùng số liệu có thể trữ trực tiếp dưới dạng kí tự (dạng ascii) hay đươc chuyển sang dạng máy gồm một loạt các số 0 và 1 (dạng nhị phân - binary format). Các dạng thức được dùng phụ thuộc vào tập tin đã được tạo ra như thế nào. Nhiều phần mềm sử dụng dạng nhị phân cho bất kì mọi thao tác và xử lí số liệu trong phần mềm nhưng chúng tạo ra tập tin dưới dạng thức ascii nếu nó sử dụng với các phần mềm khác hay chuyển tới máy khác.

Sao chép lưu Cần phải có ít nhất 3 bản sao của bất kì tập tin số liệu nào. Cả đĩa và băng từ có thể bị hư hay bị phá hủy. Tốt nhất nên giữ ít nhất một bản sao ở một nơi khác để an toàn không bị các biến cố như cháy, lụt lội và đánh cắp. Bản sao chép lưu (back-up copy) phải được thực hiện thường xuyên. Ðiều này không bao giờ được lưu ý đầy đủ.

Hơn nữa, khi được nhập vào máy tính, số liệu thường được lưu ngay vào bộ nhớ máy tính và chỉ được chuyển vào đĩa khi bộ nhớ đầy. Tốt nhất là phải đảm bảo rằng số liệu được chuyển vào đĩa thường xuyên, thí dụ như mỗi nửa giờ, để giảm thiểu số liệu bị mất và lãng phí thời gian khi máy tính bị dừng vì một số lí do. Mất điện hay treo máy do lỗi, thí dụ như cố gắng

Bảng 27.1 So sánh dạng thức cố định và tự do để lưu trữ số liệu

ID Tuổi số con tăng trọng (kg) trọng lượng trẻ sơ sinh (g)

1 21 1 11,5 3520 2 18 0 9,5 2950 3 25 1 10,6 3380 4 31 3 14,1 3860 5 23 0 9,9 3200

Dạng thức cố định 12111153520 21800952950 32511063380 43131413860 5230 993200

Dạng thức tự do 1,21,1,11.5,3520 2,18,0,9.5,2950 3,25,1,10.6,3380 4,31,3,14.1,3860 5,23,0,9.9,3200

Page 155: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

SỬ DỤNG MÁY TÍNH

151

ghi nhiều thông tin vào đĩa không còn trống, hay vô tình nhấn một số phím vào đó và có thể mất số liệu trong bộ nhớ và có thể gây phá hủy đĩa.

Phần mềm máy tính Không có máy tính nào có thể làm việc được mà không có phần mềm (soft ware). Ở mức thấp nhất là hệ điều hành (operating system), gồm các lệnh cần thiết để điều hành máy tính như ghi chép (COPY) tập tin, ghi ra màn hình (TYPE) một tập tin hay thực hiện (RUN) một chương trình, liệt kê thư mục (DIR) của một đĩa. Kế đến là chương trình (program) gồm một bộ lệnh để làm một nhiệm vụ nào đó, thí dụ như so sánh trọng lượng của trẻ với trọng lượng trung vị của tuổi đó ở trong tiêu chuẩn phát triển và tính trọng lượng quan sát được theo phần trăm của chuẩn. Một chương trình được viết trong một ngôn ngữ (language), thí dụ như Basic, Fortran, C, hay Pascal. Chương trình được chuyển thành lệnh máy nhờ bộ biên dịch (compiler). Cuối cùng nhieu chương trình áp dụng chung được gọi là gói phần mềm (package).

Các gói phần mềm mà chúng ta quan tâm có 3 loại, căn cứ dữ liệu (database), thống kê và xử lí văn bản (word-processing). Phần mềm căn cứ dữ liệu nên dùng để nhập số liệu và tạo các cấu trúc dữ liệu tổng quát, như sắp xếp và chọn một nhóm các mẫu tin. Hầu hết sẽ tạo các bản vấn lục trên màn hình và hiện lên tên các biến được nhập. Con trỏ (cursor) dùng để chỉ vị trí hiện tại và chuông sẽ kêu khi hoàn thành bản vấn lục. Lưu ý rằng một số gói phần mềm có hạn chế về tổng số biến có thể nhập cho một cá nhân nhưng có thể khắc phục bằng cách kết hợp các biến, chẳng hạn như tất cả các biến nhân trắc thành một biến dài.

Nhiều chương trình căn cứ dữ liệu cũng có thể lập bảng và tính các thống kê cơ bản. Dù vậy nói chung nên dùng gói phần mềm thống kê (statistical package) chuyên dụng để thao tác và phân tích số liệu. Phần mềm xử lí văn bản (word-processing package) hữu ích không chỉ để báo cáo kết quả mà còn để xây dựng chương trình và quy hoạch bản vấn lục. Liên kết với gói phần mềm căn cứ dữ liệu, có thể dùng để tạo ra bản vấn lục đã có một phần tông tin như tên, địa chỉ, tuổi và tránh chép bằng tay từ cuộc điều tra này sang cuộc điều tra khác.

Dù vậy, đôi khi các đòi hỏi của cuộc điều tra không thể thỏa mãn bằng bộ phần mềm. Do đó cần phải viết một số chương trình nhỏ.

Page 156: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

152

CHÈ MUÛC

95% confidence limits......................................... 25

A

a priori................................................................. 48 Âa giaïc táön suáút.............................................. 10 âaïnh dáúu............................................................. 9 âån vë báûc hai.................................................. 151 âån vë báûc mäüt............................................... 151 âäö thë................................................................... 5 âäöng biãún säú................................................... 64 âäöng nháút

phán phäúi...................................................... 11 Âäü âàûc hiãûu.................................................. 144 âäü däúc .............................................................. 54 âäü khaí dé cæûc âaûi ......................................... 93 âäü lãûch bçnh thæåìng chuáøn .......................... 21 âäü lãûch chuáøn................................................. 14

tênh toaïn ....................................................... 16 âäü lãûch chuáøn hçnh hoüc ............................. 125 Âäü nhaûy caím ................................................ 144 âäü tæû do

cuía phæång sai .............................................. 14 âäúi xæïng........................................................... 11 additive rule ........................................................ 65

Æ

Æåïc læåüng...................................................... 135

A

âënh lê giåïi haûn trung tám................................ 26 âënh tênh............................................................... 4 agesex adjusted mortality rate ............................. 99 âiãøm 5 pháön tràm............................................. 24 âiãøm chàûn ........................................................ 54 âiãøm pháön tràm................................................ 23 âiãöu tra càõt ngang

nhiãöu láön................................................... 137 analysis of variance............................................. 41 ANCOVA .............See phán têch âäöng phæång sai ANOVA.............................................................. 41 äø âéa ................................................................ 180 ÄØ âéa cæïng.................................................... 180 ÄØ âéa mãöm.................................................... 180 Âo læåìng tæí vong

caïc säú âo ...................................................... 97 trong nghiãn cæïu........................................... 96

âoaìn hãû........................................................... 138 arithmetic mean................................................... 13 association......................................................... 135 attributable risk ................................................. 155 attributable risk percent..................................... 155 âuäi dæåïi ............................................................ 11 âuäi trãn .............................................................. 11

B

backup copy ...................................................... 181 Baíng 2 × 2 (so saïnh hai tè lãû) ......................... 77 baíng 2 × c

cäng thæïc ruït goün....................................... 82 baíng dæû truì ..................................................... 77

baíng dæû truì 2 × 2 ............................................ 77 baíng gáúp 4........................................................ 77 Baíng låïn (nhiãöu haìng, nhiãöu cäüt) ............... 80 baíng säú ngáùu nhiãn ...................................... 148 baíng säúng ....................................................... 105

so saïnh ........................................................ 107 baíng säúng âoaìn hãû....................................... 105 baíng säúng hiãûn haình ................................... 105 balanced design................................................... 45 balanced with replication .................................... 45 bàòng phán phäúi bçnh thæåìng.......................... 20 bàõt càûp táöng................................................. 159 bar diagram ........................................................... 7 bäü biãn dëch .................................................... 182 bãûnh (case) ...................................................... 138 bãûnh hiãúm

giaí âënh....................................................... 157 bãûnh phäø biãún

giaí âënh....................................................... 158 Bayes................................................................... 65 Bayesian approach .............................................. 65 Berkson's fallacy ............................................... 143 between groups ................................................... 42 bias............................................................ 139, 142 biãún âäøi logistic ............................................... 93 biãún säú ............................................................... 4 biãún säú gáy nhiãùu........................................... 89 biãún säú nhë phán ............................................. 68 biãún thiãn .......................................................... 14 biãún thiãn láúy máùu........................................... 4 bimodal ............................................................... 11 binary format..................................................... 180 binary variable .................................................... 68 binomial distribution........................................... 68

C

cåî máùu........................................................ 4, 170 nguyãn lê xaïc âinh ...................................... 170

Cäng thæïc tênh cåî máùu ................................. 173 cäøng nàm thanh ................................................... 9 case control study.............................................. 138 casecontrol study............................................... 158 cáu hoíi âoïng.................................................... 140 Cáu hoíi måí...................................................... 140 censored ............................................................ 105 census................................................................ 148 central limit theorem........................................... 26 chæång trçnh..................................................... 181 chæïng (control)................................................ 138 chi square test ..................................................... 77 child years at risk ................................................. 98 Choün máùu hãû thäúng ................................... 149 Choün máùu ngáùu nhiãn âån........................... 148 clinical trials...................................................... 139 close question ................................................... 140 cluster........................................................ 150, 152 cluster analysis.................................................... 64 cluster sampling ................................................ 152 Coefficient of variation ....................................... 16 cohort ................................................................ 138 compiler ............................................................ 182 components of variation...................................... 50 Con troí ............................................................. 182

Page 157: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Chè muûc

153

conditional logistic regression .......................... 161 conditioned logistic regression ........................... 94 confidence interval.............................................. 19 confounding bias............................................... 143 consistency checks ............................................ 141 contigency table .................................................. 77 continous monitoring ........................................ 137 continuity correction ........................................... 74 control group..................................................... 164 correlation ........................................................... 51 correllation coefficient ........................................ 52 correspondance analysis...................................... 64 covariate.............................................................. 64 Cox's proprotional model.................................. 108 cross product ratio............................................. 158 crossover design................................................ 164 Crossover design............................................... 165 crosssectional study .......................................... 137 cumulative......................................................... 106 current life table ................................................ 105 cursor ................................................................ 182 cuûm ................................................................. 152

D

dán säú Phán phäúi táön suáút .................................... 11

Dán säú ................................................................. 3 dán säú cäú âënh ............................................... 138 dán säú âäüng.................................................... 138 dán säú muûc tiãu ................................................. 4 database............................................................. 182 daûng ascii ........................................................ 180 daûng thæïc cäú âënh........................................ 180 degrees of freedom........................................ 14, 27 dependent............................................................ 66 dependent variable .............................................. 54 deviance .............................................................. 94 deviation ............................................................. 14 diãûn têch dæåïi âæåìng cong ............................. 22 digit................................................................... 148 direct method ...................................................... 99 directory............................................................ 180 discordant pairs................................................. 160 discriminant function .......................................... 64 discriminat analysis............................................. 64 double blind design........................................... 166 doubleblind controlled trial............................... 139 dummy variable................................................... 62 dynamic............................................................. 138

E

efficacy.............................................................. 168 equal probability scheme .................................. 137 equal probability selection method epsem ....... 150 estimation.......................................................... 135 evaluation.......................................................... 136 exact test ....................................................... 79, 84 experimental...................................................... 136 explanatory variable............................................ 54 exponential........................................................ 108

F

factor ................................................................... 41 factor analysis ..................................................... 64 factorial ............................................................... 70

false negative rate ............................................. 144 false positive rate .............................................. 144 file..................................................................... 180 final digit........................................................... 119 finite population correction................................. 19 first stage units .................................................. 151 fivebar gates.......................................................... 9 fixed .................................................................. 138 fixed effects......................................................... 50 fourfold table ...................................................... 77 free format......................................................... 180 frequencies............................................................ 7

relative ............................................................. 7 frequency

distribution....................................................... 8 frequentist definition........................................... 65 Friedman two way ANOVA .............................. 130

G

Gaussian distribution .......................................... 20 Generalized Linear Interactive Modelling .......... 94 geometric mean................................................. 123 geometric standard deviation ............................ 125 geomtric mean..................................................... 14 giaí thuyãút trung tênh ........................................ 30 giaï trë bë khuyãút............................................... 50 giåïi haûn tin cáûy............................................... 25 giaïm saït liãn tuûc............................................ 137 goïi pháön mãöm .............................................. 182 goïi pháön mãöm thäúng kã.............................. 182

H

hai âuäi................................................................ 24 hai yãúu vë.......................................................... 11 haìm phán biãût................................................... 64 häöi cæïu................................................... 137, 153 Häöi quy bæåïc luìi............................................. 62 Häöi quy bæåïc tåïi............................................. 62 häöi quy bäüi ................................................ 42, 58

vaì phán têch phæång sai ............................... 63 Häöi quy bäüi våïi 2 biãún säú............................ 59 Häöi quy bäüi våïi caïc biãún giaíi thêch phi tuyãún

tênh ................................................................ 63 Häöi quy bäüi våïi caïc biãún giaíi thêch råìi raûc62 Häöi quy bäüi våïi nhiãöu biãún ......................... 61 häöi quy logistic............................................ 64, 93 häöi quy logistic coï âiãöu kiãûn ................ 94, 161 Häöi quy täø håüp täúi æu ................................. 62 Häöi quy tuyãún tênh.......................................... 54 Häöi quy vãö trung bçnh................................... 145 hardware ........................................................... 179 hãû âiãöu haình................................................. 181 hãû säú häöi quy riãng pháön ............................. 60 hãû säú tæång quan............................................. 52

vaì baíng phán têch phæång sai...................... 59 hãû säú tæång quan bäüi ..................................... 60 hazard rate......................................................... 108 Helsinki Declaration ......................................... 166 hiãûu chènh tênh liãn tuûc .................................. 74 hiãûu chènh tênh liãn tuûc cuía Yates................. 78 hiãûu læûc......................................................... 168 hiãûu säú hai trung bçnh

phán phäúi láúy máùu .................................... 37 hierarchical structure......................................... 151 histogram .............................................................. 9

Page 158: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

154

I

ì thaình pháön cuía sæû biãún thiãn.................... 50 incidence............................................................. 97 incidence rate ...................................................... 98 incidence risk ...................................................... 98 independent variable ........................................... 54 indirect method ................................................... 99 information bias ................................................ 143 interaction ........................................................... 45 intercept .............................................................. 54 intervention trials .............................................. 139

J

J ngæåüc phán phäúi...................................................... 11

K

kç voüng säúng ................................................. 107 kê tæû................................................................ 180 Kendall's rank correlation ................................. 130 khoaíng tin cáûy............................................ 19, 28 khung máùu ...................................................... 148 Kiãøm âënh bçnh thæåìng................................... 34 kiãøm âënh chênh xaïc........................................ 79

Fisher ............................................................. 84 Kiãøm âënh chênh xaïc

cho baíng 2 x 2............................................... 84 kiãøm âënh chi bçnh phæång.............................. 77 Kiãøm âënh chi bçnh phæång ............................. 77 Kiãøm âënh chi bçnh phæång âënh hæåïng ........ 91 kiãøm âënh log rank.......................................... 107 Kiãøm âënh mäüt âuäi......................................... 33 Kiãøm âënh phuì håüp

phæång phaïp chi bçnh phæång ................... 118 Kiãøm âënh sàõp haûng coï dáúu Wilcoxon..... 131 Kiãøm âënh t càûp âäi......................................... 30 kiãøm âënh t hai âuäi .......................................... 33 Kiãøm âënh t mäüt máùu .................................... 33 Kiãøm âënh täøng sàõp haûng Wilcoxon.......... 132 kiãøm âënh yï nghéa

quan hãû våïi khoaíng tin cáûy....................... 32 Kiãøm âënh yï nghéa........................................... 30

duìng xáúp xè bçnh thæåìng........................... 73 kiãøm chæïng.................................................... 141 Kiãøm tra phaûm vi .......................................... 141 Kiãøm tra säú liãûu ........................................... 141 Kiãøm tra tênh phuì håüp.................................. 141 KolmogorovSmirnov test .................................. 130 Kruskal Wallis oneway ANOVA...................... 130

L

Læåüng giaï....................................................... 136 language............................................................ 181 lãûch.................................................................... 11 láúy máùu.......................................................... 148 láúy máùu cuûm........................................ 150, 152 Láúy máùu cuûm............................................... 152 láúy máùu hai báûc ........................................... 151 láúy máùu hoaìn laûi......................................... 151 láúy máùu nhiãöu báûc ............................. 150, 152 Láúy máùu nhiãöu báûc .................................... 151 láúy máùu phán táöng ....................................... 150 Láúy máùu phán táöng...................................... 150 least squares fit.................................................... 54 liãn tuûc ................................................................ 4

life expectancy .................................................. 107 life table ............................................................ 105 linear ................................................................... 51 linear regression.................................................. 51 log linear model .................................................. 94 logistic regression ............................................... 93 logit................................................................... 127 lognormal distribution ...................................... 122 longitudinal study ............................................. 137

M

mä hçnh muî ..................................................... 108 mä hçnh nguy cå tè lãû cuía Cox ...................... 108 mä hçnh tuyãún tênh log..................................... 94 Mä thæïc säúng coìn ......................................... 108 mæïc yï nghéa ............................................... 30, 31 main effect .......................................................... 45 mainframe ......................................................... 179 maïy tênh

trong phán têch thäúng kã ............................ 179 maïy tênh cáöm tay ............................................... 6

trong häöi quy tuyãún tênh............................. 57 maïy tênh låïn.................................................... 179 Mann Whitney U test ........................................ 130 màõc toaìn bäü.................................................... 97 màõc toaìn bäü thåìi âiãøm ................................. 97 matched............................................................. 164 matched data ....................................................... 94 matched design ................................................. 160 matched pair design .......................................... 165 matched paired design......................................... 86 mäüt âuäi............................................................. 24 mäüt yãúu vë....................................................... 11 máùu ............................................................. 3, 148 máùu cåî låïn....................................................... 25 Máùu nhoí........................................................... 26 máùu tin ............................................................ 180 maximum likelihood ........................................... 93 mean square ........................................................ 42 median ................................................................ 13 method of linear contrasts................................... 48 missing value ...................................................... 50 mode ................................................................... 13 monitor.............................................................. 179 MS regression ..................................................... 59 MS residual......................................................... 59 mulitple invasion .............................................. 120 mulplicative rule ................................................. 65 multiple comparison ........................................... 79 multiple correlation coefficient ........................... 60 multiple regression.............................................. 42 multiple regression equation ............................... 59 multiple response questions .............................. 141 multi-stage sampling......................................... 152 multi stage.......................................................... 150 multi stage sampling .......................................... 151

N

nàng læûc.................................................... 35, 170 natural logarithms ............................................. 123 ngän ngæî.......................................................... 181 ngäü biãûn Berkson .......................................... 143 ngáùu nhiãn hoïa cán bàòng.............................. 165 ngáùu nhiãn hoïa giåïi haûn .............................. 165 nghiãn cæïu

Page 159: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Chè muûc

155

láûp kãú hoaûch ........................................... 135 muûc tiãu...................................................... 135 tiãún haình ................................................... 135

nghiãn cæïu âoaìn hãû....................................... 153 Nghiãn cæïu bãûnh chæïng....................... 138, 158 Nghiãn cæïu can thiãûp..................................... 169 nghiãn cæïu càõt doüc....................................... 137 Nghiãn cæïu càõt ngang.................................... 137 Nghiãn cæïu quan saït....................................... 136 nghiãn cæïu thæí nghiãûm

bàõt cheïo..................................................... 165 Nghiãn cæïu thæûc nghiãûm............................. 139 nguy cå

bãûnh hiãúm - bãûnh phäø biãún ................... 98 Nguy cå måïi màõc.............................................. 98 Nguy cå qui traïch............................................. 154 nguy cå quy traïch............................................. 155 nguy cå quy traïch dán säú................................ 156 nguy cå tæång âäúi...................................... 99, 154 nhæîng càûp khäng phuì håüp .......................... 160 nhë phán........................................................ 4, 180 nhoïm âiãöu trë ................................................. 164 nhoïm chæïng.................................................... 164 normal distribution.............................................. 20 null hypothesis .................................................... 30 numerical taxonomy............................................ 64

O

observational..................................................... 136 odds................................................................... 156 odds ratio .......................................................... 156 one sided ............................................................. 24 onesided .............................................................. 33 oneway analysis of variance................................ 42 open question.................................................... 140 operating system ............................................... 181 Optimal combination regression ......................... 62 overall sample value.......................................... 150

P

package ............................................................. 182 paired .................................................................. 86 paired t test.......................................................... 30 partial correlations .............................................. 60 partial regression coefficients ............................. 60 period prevalence................................................ 97 persons at risk ..................................................... 97 person years at risk............................................... 98 person years of observation.................................. 96 phæång phaïp choün læûa xaïc suáút bàòng nhau

..................................................................... 150 phæång phaïp chuáøn hoaï giaïn tiãúp................ 99 phæång phaïp chuáøn hoïa træûc tiãúp............... 99 Phæång sai .......................................................... 14 phán loaûi hoüc sä .............................................. 64 phán phäúi

kiãøm âënh tênh phuì håüp .......................... 116 phán phäúi bçnh thæåìng

kiãøm âënh tênh phuì håüp .......................... 116 phán phäúi bçnh thæåìng chuáøn........................ 21 Phán phäúi bçnh thæåìng chuáøn........................ 21 phán phäúi F ....................................................... 43 phán phäúi nhë thæïc .......................................... 68

xáúp xè phán phäúi bçnh thæåìng .................. 73 Phán phäúi nhë thæïc .......................................... 68

phán phäúi Poisson Hçnh daïng................................................... 111

Phán phäúi Poisson........................................... 110 âënh nghéa ................................................... 110 vaì tè suáút ................................................... 113

phán phäúi t ........................................................ 27 våïi (n-1) âäü tæû do ...................................... 27

phán phäúi táön suáút Hçnh daûng.................................................... 11

phán säú láúy máùu..................................... 19, 150 phán säú quy traïch dán säú .............................. 156 Phán taïn âäö....................................................... 52 phán têch âa biãún .............................................. 64 Phán têch âa biãún .............................................. 64 phán têch âäöng phæång sai................................ 63 phán têch cuûm................................................... 64 Phán têch nhiãöu baíng 2 × 2.............................. 88 phán têch phæång sai .......................................... 41

trong häöi quy tuyãún tênh............................. 58 yãúu täú.......................................................... 41

Phán têch phæång sai hai chiãöu ........................ 45 Phán têch phæång sai mäüt chiãöu ..................... 42 Phán têch phán biãût........................................... 64 Phán têch säú liãûu ............................................... 5 phán têch säúng coìn......................................... 105 phán têch tæång æïng.......................................... 64 Phán têch tè suáút ............................................. 104 Phán têch thaình pháön chênh ............................ 64 Phán têch thäúng kã häü tëch............................ 136 Phán têch yãúu täú .............................................. 64 pháön cæïng...................................................... 179 pháön mãöm...................................................... 181 Pháön mãöm càn cæï dæî liãûu......................... 182 Pháön mãöm maïy tênh..................................... 181 Pháön mãöm xæí lê vàn baín ............................ 182 phaûm truì............................................................. 4 phaûm vi ............................................................. 14 pheïp biãún âäøi

læûa choün ................................................... 127 Pheïp biãún âäøi................................................ 122

logarithm...................................................... 122 pheïp biãún âäøi láúy càn.................................. 127 pheïp biãún âäøi láúy luîy thæìa ....................... 127 pheïp biãún âäøi nghëch âaío............................ 127 phi tham säú........................................................ 28

phæång phaïp ............................................... 129 pie chart ................................................................ 7 placebo.............................................................. 166 point prevalence.................................................. 97 population attributable fraction......................... 156 population attributable risk ............................... 156 population proportional attributable risk .......... 156 posterior probability............................................ 65 power .......................................................... 35, 170 power transformation ........................................ 127 powerful.............................................................. 41 prevalence ........................................................... 97 pricipal component analysis................................ 64 prior probability.................................................. 65 probability proportional to size p.p.s ............... 151 probit................................................................. 116 probit plot ......................................................... 116 program............................................................. 181 prophylactic trials ............................................. 139 proportion ........................................................... 68 proportional attributable risk ............................ 155

Page 160: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Căn bản thống kê y học -Ðỗ Văn Dũng

156

prospective................................................ 137, 153

Q

quan saït ........................................................ 4, 136 Qui hoaûch cán âäúi

coï làûp........................................................... 45 Quy hoaûch baín váún luûc............................... 139 quy hoaûch bàõt càûp âäi.................................. 165 quy hoaûch cán âäúi............................................ 45

khäng coï làûp ................................................ 45 Quy hoaûch cán âäúi coï làûp ............................. 45 Quy hoaûch cán âäúi khäng làûp ........................ 46 quy hoaûch khäng cán âäúi ................................. 45 Quy hoaûch khäng cán âäúi ................................ 48 quy hoaûch muì âäi ........................................... 166 Quy hoaûch muì âån ......................................... 166 Quy tàõc cäüng ................................................... 65

xaïc suáút ....................................................... 66 Quy tàõc nhán ..................................................... 65

xaïc suáút ....................................................... 65

R

råìi raûc ................................................................. 4 RAM ................................................................. 179 random access file............................................. 180 random effects..................................................... 50 randomization ................................................... 164 randomization with balance .............................. 165 randomized controlled doubleblind design ....... 142 range ................................................................... 14 range checks...................................................... 141 rank ................................................................... 131 rate ...................................................................... 95 reciprocal transformation .................................. 127 records .............................................................. 180 Registrar General .............................................. 136 regression coefficient .......................................... 54 relative risk ................................................. 99, 154 Relative risk ...................................................... 154 repeated cross sectional surveys........................ 137 residual sum of squares ................................. 42, 58 restricted randomization.................................... 165 restrospective .................................................... 137 retrospective...................................................... 153 reverse Jshaped ................................................... 11 risk ...................................................................... 96 robustness ........................................................... 27 root transformation ........................................... 127

S

så âäö xaïc suáút cán bàòng .............................. 137 sæû liãn quan .................................................... 135 sæû sai lãûch khoíi âënh hæåïng phuì håüp ........ 92 sai láöm

trong kiãøm âënh giaí thuyãút ........................ 35 sai lãûch ...................................................... 89, 142 Sai lãûch gáy nhiãùu ......................................... 143 Sai lãûch thäng tin ............................................ 143 sai säú

hãû thäúng.................................................... 142 ngáùu nhiãn.................................................. 142 nguäön gäúc ................................................. 142

Sai säú choün læûa............................................ 142 sai säú chuáøn ..................................................... 17

cuía trung bçnh máùu..................................... 17

Sai säú láúy máùu ............................................... 17 sample ............................................................... 148 sampling fraction ........................................ 19, 150 sampling frame.................................................. 148 Sao cheïp læu.................................................... 181 säú chãnh .......................................................... 156 säú luîy têch ...................................................... 117 Säú måïi màõc..................................................... 97 säú màõc toaìn bäü thåìi khoaíng........................ 97 säú ngæåìi nàm quan saït .................................... 96 scatter diagram.................................................... 52 screening test .................................................... 144 second stage units .............................................. 151 selection bias............................................. 142, 164 sensitivity.......................................................... 144 sequential clinical trial ...................................... 166 sequential file.................................................... 180 sign test ............................................................. 130 significance level ................................................ 30 significant test ..................................................... 30 simple random sampling ................................... 148 single blind design ............................................ 166 skewed ................................................................ 11 So saïnh 2 tè lãû.................................................. 86 so saïnh 2 trung bçnh

máùu låïn hay biãút âäü lãûch chuáøn ........... 38 so saïnh hai trung bçnh

Cåî máùu nhoí, âäü lãûch chuáøn khäng bàòng nhau........................................................... 40

máùu låïn hay biãút âäü lãûch chuáøn ........... 37 So saïnh hai trung bçnh....................................... 37 So saïnh nhiãöu trung bçnh... See phán têch phæång

sai soft ware............................................................ 181 Spearman .......................................................... 133 specificity.......................................................... 144 spill over effect .................................................. 165 standard deviation............................................... 14 standard error of the sample mean ...................... 17 standard normal deviate ...................................... 21 standard normal distribution ............................... 21 standard population............................................. 99 standardization.................................................... 99 standardized mortality ratio ................................ 99 statistical package ............................................. 182 Step down regression .......................................... 62 Step up regression................................................ 62 strata.................................................................. 150 stratified ............................................................ 150 study design ...................................................... 135 subjective definition............................................ 65 sum of square ...................................................... 42 summary test ....................................................... 89 symmetrical......................................................... 11 systematic.......................................................... 142

T

t distribution........................................................ 27 table of random numbers .................................. 148 tæång phaín tuyãún tênh ..................................... 48 Tæång quan......................................................... 52 tæång quan riãng pháön ...................................... 60 Tæång quan sàõp haûng Spearman................... 133 tæång quan têch moment Pearson..................... 133 tæång taïc ............................................................ 45

Page 161: MỤC LỤC - Trần Quang Hiền | Hạnh phúc là khi ... · 1 LỜI NÓI —ẦU Mục đích của việc viết cuốn sÆch này là đưa những phương phÆp thống kŒ

Chè muûc

157

taïc âäüng cäú âënh ............................................. 50 taïc âäüng chênh.................................................. 45 taïc âäüng ngáùu nhiãn ....................................... 50 taïc âäüng täön dæ............................................. 165 tails

upper and lower.............................................. 11 tallying .................................................................. 9 Täø chæïc âäö ....................................................... 9 Täø chæïc dæî liãûu .......................................... 180 táön suáút

säú liãûu âënh læåüng ...................................... 8 Táön suáút

säú liãûu âënh tênh........................................... 7 táön suáút tæång âäúi ............................................ 7 táöng ................................................................. 150 täøng âiãöu tra................................................... 148 täøng bçnh phæång häöi quy............................... 58 täøng bçnh phæång pháön dæ....................... 42, 58 täøng caïc bçnh phæång...................................... 42 täøng caïc bçnh phæång âæåüc giaíi thêch båíi häöi

quy ................................................................. 58 táûp tin .............................................................. 180 Táûp tin truy cáûp ngáùu nhiãn ........................ 180 táûp tin tuáön tæû ............................................. 180 Tè lãû .................................................................. 68 tè lãû âån

kiãøm âënh yï nghéa....................................... 71 tè säú säú chãnh ................................................ 156 tè säú tæí vong chuáøn hoïa ................................ 99 tè suáút ám tênh giaí ......................................... 144 Tè suáút chuáøn hoïa .......................................... 99 tè suáút dæång tênh giaí.................................... 144 tè suáút måïi màõc .............................................. 98

phán têch ...................................................... 113 tè suáút nguy haûi ............................................. 108 Tè suáút sinh ....................................................... 95 Tè suáút tæí vong................................................ 95 tè suáút tæí vong âæåüc âiãöu chènh theo tuäøi giåïi

tênh ................................................................ 99 Tè suáút tæí vong âæåüc âiãöu chènh theo tuäøi

giåïi tênh ...................................................... 103 tênh væîng........................................................... 27 thæ muûc........................................................... 180 Thæí nghiãûm can thiãûp.................................. 139 thæí nghiãûm coï kiãøm soaït muì âäi............... 139 Thæí nghiãûm lám saìng ........................... 139, 164 thæí nghiãûm saìng loüc ................................... 144 Thæí nghiãûm vaccine .............................. 139, 168 thæûc nghiãûm.................................................. 136 thåìi gian säúng coìn ......................................... 105 Thäúng kã ............................................................. 3 Thay âäøi âån vë ................................................. 17 tiãön cæïu.................................................. 137, 153 trçnh baìy kãút quaí............................................... 5 treatment group ................................................. 164 trung bçnh ........................................................... 13

khoaíng tin cáûy............................................. 25 tênh toaïn ....................................................... 16

trung bçnh bçnh phæång..................................... 42 trung bçnh chuáøn hoïa..................................... 100 trung bçnh nhán .......................................... 14, 123 trung vë ............................................................... 13 tuyãn ngän Helsinki .......................................... 166 two stage sampling............................................ 151 two sided............................................................. 24 two sided.............................................................. 33

U

unbalanced design............................................... 45 uniform ............................................................... 11 unimodal ............................................................. 11

V

vaccine trials ..................................................... 139 validity ................................................................ 79 variance............................................................... 14 varianceratio ....................................................... 43 verification........................................................ 141 vital statisitics ................................................... 136

W

Wilcoxon .......................................................... 131 Wilcoxon rank sum test .................................... 132 Wilcoxon sign rank test............................. 130, 131 with replacement............................................... 151 with replication ................................................... 45 within groups ...................................................... 42 without replication .............................................. 45 word-processing package.................................. 182 word processing ................................................. 182

X

xaïc suáút ............................................................ 65 âënh nghéa chuí quan..................................... 65 Âënh nghéa theo táön suáút ........................... 65 quy tàõc.......................................................... 65

xaïc suáút âiãöu kiãûn......................................... 66 xaïc suáút háûu nghiãûm..................................... 65 xaïc suáút tè lãû våïi kêch thæåïc...................... 151 xaïc suáút tiãön nghiãûm .................................... 65

Y

Yates' continuity correction ................................ 78 yãúu vë................................................................ 13

Z

z 21

χ

χ2 goodness of fit............................................... 130