Upload
vuongkhue
View
235
Download
0
Embed Size (px)
Citation preview
1
Cách tính cỡ mẫu
Mục tiêu
Sau khi nghiên cứu bài này, hội thảo viên có khả năng:
(i) Phân biệt hai cách tiếp cận trong cách tính cỡ mẫu: ước lượng tham số hay kiểm định giả
thuyết
(ii) Trình bày công thức tính toán cỡ mẫu để ước lượng một tỉ lệ, ước lượng một trung bình,
so sánh 2 tỉ lệ và so sánh 2 trung bình
(iii) Sử dụng phần mềm Stata để tính toán cỡ mẫu cho một nghiên cứu cụ thể
Giới thiệu
Trong nghiên cứu khoa học, có 2 loại câu hỏi nghiên cứu. Loại thứ nhất: quy mô của vấn đề
là lớn hay nhỏ, số đo liên quan của 2 biến số là lớn hay nhỏ. Loại thứ hai: Có hay không sự
khác biệt của quy mô vấn đề giữa các nhóm hoặc có hay không sự liên quan giữa các nhóm.
Loại câu hỏi nghiên cứu thứ nhất được trả lời bằng một con số trong khi loại câu hỏi nghiên
cứu thứ hai được trả lời là có hay không. Do có hai loại câu hỏi nghiên cứu, chúng ta có 2
cách tiếp cận trong cách tính cỡ mẫu.
Hai cách tiếp cận trong tính cỡ mẫu
Trên cơ bản có hai cách tiếp cận trong tính cỡ mẫu:
(a) tính cỡ mẫu để ước lượng của một tỉ lệ, một trung bình, hiệu số, nguy cơ tương đối
với một mức độ chính xác nhất định. Thí dụ, để ước lượng tỉ lệ trẻ em trong lứa từ
12-23 tháng tuổi được tiêm chủng đầy đủ (với độ chính xác) trong vòng 10%. Thông
tin chìa khóa để tính cỡ mẫu cho ước lượng một tham số là chúng ta chấp nhận sai số
tối đa cho phép là bao nhiêu. Nếu chấp nhận sai số tối đa cho phép lớn thì cỡ mẫu cần
thiết sẽ nhỏ đi và ngược lại, nếu chấp nhận sai số tối đa cho phép nhỏ thì cỡ mẫu cần
thiết sẽ phải lớn.
(b) tính cỡ mẫu để kiểm định giả thuyết. Thí dụ, so sánh thời gian bú sữa mẹ hoàn
toàn ở 2 nhóm có giáo dục sức khỏe và nhóm chứng hoặc tỉ lệ bị xuất huyết sau sinh ở
2 nhóm phụ nữ, nhóm can thiệp được dùng thuốc co cơ tử cung để dự phòng xuất
huyết sau sinh và nhóm chứng không được dùng thuốc co cơ tử cung để dự phòng.
Thông tin chìa khóa để tính cỡ mẫu cho kiểm định giả thuyết là chúng ta chấp nhận
xác suất mắc sai lầm trong kiểm định giả thuyết nghiên cứu là bao nhiêu? Nếu chúng
ta chấp nhận xác suất mắc sai lầm lớn thì chúng ta chỉ cần cỡ mẫu nhỏ, ngược lại, nếu
chúng ta muốn xác suất mắc sai lầm nhỏ thì cỡ mẫu cần thiết sẽ phải lớn.
Vấn đề xác định cỡ mẫu trong nghiên cứu khoa học là một vấn đề quan trọng. Nếu chúng ta
lấy một cỡ mẫu quá lớn thì chúng ta rõ ràng lãng phì tiền bạc và thời gian. Nếu chúng ta lấy
mẫu quá nhỏ thì kết quả của nghiên cứu sẽ không có độ chính xác mong muốn (trong trường
hợp nghiên cứu để ước lượng) hoặc có xác suất mắc sai lầm lớn (trong trường hợp nghiên
cứu để so sánh hay kiểm định) thì nghiên cứu sẽ không có giá trị khoa học và như vậy công
trình nghiên cứu đó cũng là một sự lãng phí.
Khái niệm về sai số biên (marginal error)
Giả sử tôi đo một chiếc bàn dài 90 cm và trong 10 lần đo lường tôi bị sai số là 1 cm, 3 cm, 4
cm, 7 cm, 2 cm, 5 cm, 6 cm, 0 cm, 2 cm, 3 cm. Ở các lần đo có sai số khác nhau nhưng sai số
không bao giờ vượt quá 7 cm thì tôi gọi sai số biên là 7cm.
Tuy nhiên có trường hợp tôi không thể khẳng định chắc chắn về sai số biên nhưng nếu tôi
biết khẳng định sai số đo lường không vượt quá 7 cm có khả năng đúng là 0.95 thì tôi thì kết
2
luận sai số biên là 7cm với mức tin cậy là 95%.
Nếu tôi không biết chiều dài của chiếc bàn nhưng nếu tôi đo được chiếc bàn là 100 cm và
phương pháp do của tôi có sai số biên là 7cm với mức tin cậy là 95%. Tôi kết luận rằng
khẳng định chiều dài thật của chiếc bàn nằm trong khoảng từ 93 cm đến 107 cm có khả năng
đúng đến 95%.
Cỡ mẫu để ước lượng tham số
Ước lượng một tỉ lệ với một sai số biên cho trước
Công thức tính cỡ mẫu cho ước lượng một tỉ lệ p với sai số biên d ở mức tin cậy (1-) của là:
2
2
2/1
)1(
d
ppZn
Trong đó Z1-α/2 là phân vị của phân phối chuẩn bình thường (standard normal distribution) tại
1-α/2. Nếu chúng ta muốn tính cỡ mẫu ở mức tin cậy 95% thì α=0.05 và Z1-α/2 = Z0.975 = 1,96
Phân vị của phân phối chuẩn bình thường ở các mức tin cậy khác có thể tìm bằng cách tra
bảng của phân phối chuẩn bình thường hoặc sử dụng hàm qnorm() trong ngôn ngữ R, hàm
invnormal() trong phần mềm Stata hoặc hàm NORMSINV() của phần mềm Excel.
Thí dụ: Một nghiên cứu về hiệu quả điều trị của tenofovir trên bệnh nhân viêm gan B mạn
tính ở một bệnh viện muốn ước lượng tỉ lệ bệnh nhân có lượng HBV DNA > 105 copies/ml
máu trở thành HBV DNA âm tính ở tháng thứ 12 với sai số biên cho phép d=6% ở mức tin
cậy 95%. Tỉ lệ chuyển âm của HBV DNA sau 12 tháng điều trị với tenofovir ở bệnh nhân
viêm gan B mạn tính bệnh viện đó là chưa biết (vì vậy mới cần làm nghiên cứu này) nhưng tỉ
lệ này được báo cáo từ các nghiên cứu trên quần thể bệnh nhân tương tự gợi ý p=40% là phán
đoán hợp lí nhất. Cỡ mẫu cần thiết cho nghiên cứu này là:
1.2560036.0
24.0842.3
06.0
6.04.096.1
)1(2
2
2
2
2/1
d
ppZn
Vì cỡ mẫu phải là số nguyên nên chúng ta làm tròn lên và chọn cỡ mẫu là 257.
Trong Stata, lệnh zpsampsi có thể sử dụng để tính cỡ mẫu nhằm ước lượng tỉ lệ (package do
Đỗ Văn Dũng viết). Cú pháp của lệnh zpsampi là:
zzppssaammppssii,, pprrooppoorrttiioonn((00..55)) eerrrroorr((00..11)) lleevveell((9955)) ddeessiiggnn((11))
Áp dụng lệnh zpsampsi trong trường hợp tỉ lệ ước đoán p=0.4 và sai số biên d=0.06 ta có cỡ
mẫu cần thiết
.. zzppssaammppssii,, pprrooppoorrttiioonn((00..44)) eerrrroorr((00..0066))
EEssttiimmaatteedd ssaammppllee ssiizzee ffoorr eessttiimmaattiinngg pprrooppoorrttiioonn ffrroomm aa ddeessccrriippttiivvee ssttuuddyy
AAssssuummppttiioonnss::
pp == ..44
MMaarrggiinnaall eerrrroorr == ..0066
DDeessiiggnn eeffffeecctt == 11
AAllpphhaa == ..0055
LLeevveell ooff ccoonnffiiddeennccee == 9955%%
EEssttiimmaatteedd rreeqquuiirreedd ssaammppllee ssiizzee::
nn == 225577
1- Ước đoán tỉ lệ p
Một thắc mắc hay nẩy sinh trong khi nghiên cứu công thức này là trong khi chúng ta muốn
nghiên cứu ước lượng p nhưng trong khi tính toán để tính cỡ mẫu chúng ta phải có giá trị của
3
tỉ lệ p! Toàn bộ logic của vấn đề là ở chỗ chúng ta có thể ước đoán p trước lúc nghiên cứu
một cách không chính xác, sau nghiên cứu chúng ta có thể ước lượng p một cách chính xác
hơn nhiều. Ta có thể ước đoán p sử dụng những nghiên cứu trước đó (chọn lựa nghiên cứu
nào phù hợp nhất về thời gian nghiên cứu, về quần thể nghiên cứu), sử dụng nghiên cứu dẫn
đường, sử dụng ý kiến chuyên gia hay phán đoán cá nhân.
Nếu chúng ta không thể ước đoán một giá trị cụ thể của p, chúng ta có thể ước đoán một
khoảng giá trị của p. Thí dụ mặc dù chúng ta không biết tỉ lệ trẻ dưới 5 tuổi ở một tỉnh bị suy
dinh dưỡng là bao nhiêu, chúng ta có thể ước đoán tỉ lệ trẻ dưới 5 tuổi bị suy dinh dưỡng ở
tính đó nằm trong khoảng từ 10% đến 30%. Khi đó, chúng ta chọn p ước đoán để đưa vào
công thức tính cỡ mẫu là giá trị gần với 50%. Trong trường hợp cụ thể này, chúng ta chọn p
ước đoán để đưa vào công thức tính cỡ mẫu là 30%.
Trong trường hợp chúng ta không thể ước đoán p và cho rằng p có thể thay đổi từ 0% đến
100%, ta có thể ước đoán p =0,5, vì ở tỉ lệ ước đoán này tương ứng với cỡ mẫu lớn nhất (do
đó có tính chất an toàn nhất).
2. Chọn lựa sai số biên d
Không có quy tắc cứng nhắc độ chính xác d, điều này phụ thuộc vào mục tiêu của nghiên cứu
và vào tài nguyên hiện có. Thông thường sai số biên d phải đủ nhỏ để kết quả của nghiên cứu
có thể giúp chúng ta ra quyết định hoặc giúp chúng ta phát hiện khuynh hướng thay đổi.
Nhưng sai số biên không được quá nhỏ làm ảnh hưởng đến tính khả thi của nghiên cứu.
Trong trường hợp chưa có nhiều thông tin, một quy tắc xác định sai số biên được tác giả
Virasakdi Chongsuvivatwong đề xuất:
- Nếu tỉ lệ p từ 0,3 đến 0,7; sai số biên là 10%
- Nếu tỉ lệ p từ 0,1 đến <0,3 hoặc tỉ lệ p >0,7 đến 0.9: sai số biên là 5%
- Nếu tỉ lệ p <0,1: sai số biên là p/2
- Nếu tỉ lệ p>0.9: sai số biên là (1-p)/2
Đôi khi người ta không cho sai số d nhưng lại trình bày bài toán bằng cách đưa tỉ lệ giả thuyết
(hypothesized proportion) và tỉ lệ đòi hỏi (postulated proportion). Thí dụ một nghiên cứu
muốn khảo sát tỉ lệ tiêm chủng đủ ở trẻ em dưới 2 tuổi và ước đoán tỉ lệ tiêm chủng đủ là
80% nhưng đòi hỏi tỉ lệ tiêm chủng đủ phải lớn hơn 75% (Nếu tỉ lệ tiêm chủng đủ dưới 75%
là xem như chương trình tiêm chủng không đạt yêu cầu). Khi đó ta tính công thức xác định
cỡ mẫu với tỉ lệ ước đoán là tỉ lệ giả thuyết=80%, sai số biên là trị tuyệt đối của hiệu số tỉ lệ
giả thuyết và tỉ lệ đòi hỏi, d=5% với mức tin cậy 95%. Cỡ mẫu cần thiết là:
3. Hiệu chỉnh cho nghiên cứu với phương pháp lấy mẫu cụm
- Công thức được trình bày là dành cho phép lấy mẫu ngẫu nhiên đơn. Nếu nghiên cứu sử
dụng phương pháp lấy mẫu cụm cần phải hiệu chỉnh tác động làm giảm độ chính xác của việc
chọn cụm bằng cách tăng cỡ mẫu. Cỡ mẫu trong nghiên cứu lấy mẫu cụm thường được nhân
lên với một hệ số (được gọi là hệ số thiết kế) có giá trị từ 2 đến 4. Khi đó công thức tính cỡ
mẫu để ước lượng tỉ lệ là:
2
2
2/1
)1(
d
ppZCn
Với C là hệ số thiết kế.
Hệ số thiết kế thấp nếu biến cố phân bố tương đối đồng đều trong quần thể. Hệ số thiết kế cáo
nếu biến cố có tính chất tập trung ở một số khu vực trong quần thể. Thí dụ nghiên cứu về tỉ lệ
của nhóm máu sẽ có hệ số thiết kế thấp hơn hơn hệ số của nghiên cứu về tỉ lệ bị cúm H1N1
trong cộng đồng. Hệ số thiết kế có thể tính được từ việc nghiên cứu thử. Nếu không có điều
kiện thực hiện nghiên cứu thử, tính hệ số thiết kế có thể chọn hệ số thiết kế là 3 hay 4.
Hàm n.for.survey của ngôn ngữ R có đối số deff (design effect for cluster sampling) để hiệu
chỉnh cho lấy mẫu cụm. Quay trở lại thí dụ về nghiên cứu ước lượng tỉ lệ tiêm chủng với tỉ lệ
4
ước đoán là tỉ lệ giả thuyết=80%, sai số biên d=5% với mức tin cậy 95%, giả sử chúng ta sử
dụng phương pháp lấy mẫu cụm với hệ số thiết kế deff=2, cỡ mẫu cần thiết là
Lệnh zpsampsi trong Stata cũng có thể được sử dụng để hiệu chỉnh cho hệ số thiết kế:
.. zzppssaammppssii,, pprrooppoorrttiioonn((00..88)) eerrrroorr((00..0055)) ddeessiiggnn((22))
EEssttiimmaatteedd ssaammppllee ssiizzee ffoorr eessttiimmaattiinngg pprrooppoorrttiioonn ffrroomm aa ddeessccrriippttiivvee ssttuuddyy
AAssssuummppttiioonnss::
pp == ..88
MMaarrggiinnaall eerrrroorr == ..0055
DDeessiiggnn eeffffeecctt == 22
AAllpphhaa == ..0055
LLeevveell ooff ccoonnffiiddeennccee == 9955%%
EEssttiimmaatteedd rreeqquuiirreedd ssaammppllee ssiizzee::
nn == 449922
4. Hiệu chỉnh để tính cỡ mẫu khi dân số đích là hữu hạn
Công thức tính cỡ mẫu trên là dành lấy mẫu từ một dân số đích vô hạn hay khá lớn. Nếu cỡ
mẫu chiếm tỉ lệ trên 10% dân số đích, ta có thể điều chỉnh để có cỡ mẫu nhỏ hơn.
PN
PNNhc
Với N là cỡ mẫu chưa hiệu chỉnh, P là kích thước của dân số đích và Nhc là cỡ mẫu sau khi đã
hiệu chỉnh. Nếu chúng ta muốn tính cỡ mẫu để ước lượng tỉ lệ sử dụng bao cao su khi quan
hệ tình dục với khách hàng ở phụ nữ mãi dâm quận 11 được tiếp cận với chương trình giáo
dục đồng đẳng. Với tỉ lệ đoán sử dụng bao cao su là 50%, sai số biên là 5% với mức tin cậy
95%, và số phụ nữ mãi dâm ở quận 11 tiếp cận được với chương trình giáo dục đồng đẳng là
634 người, cỡ mẫu chưa hiệu chỉnh được tính là:
38405.005.0
5.05.084.3
)1(2
2
2/1
d
ppZN
Cỡ mẫu hiệu chỉnh cho dân số đích =634 là
239634384
634384
PN
PNNhc
5. Hiệu chỉnh để tính cỡ mẫu nhằm ước lượng
Chúng ta cũng nên phải trù liệu cho những số liệu bị mất, những trường hợp từ chối nghiên
cứu bằng cách tăng cỡ mẫu.
6. Một thí dụ về tính cỡ mẫu nghiên cứu thử nghiệm lâm sàng nhằm mô tả tỉ lệ
Dưới đây là một đoạn về tính cỡ mẫu trong một nghiên cứu loạt ca với mục tiêu chính là xác
định hiệu quả của điều trị:
Cỡ mẫu cần thiết
Đây là một nghiên cứu không can thiệp và quan sát nên cỡ mẫu 500 bệnh nhân là dựa trên
tính khả thi.
Giả định với cỡ mẫu 500, nó có thể cho phép ước lượng tỉ lệ của Triệu chứng X ở bệnh nhân
B (dựa trên khoảng tin cậy hai bên 95%) với độ chính xác tối đa 0,045 với tỉ lệ ước tính là
0,50.
Phân tích thống kê sẽ chỉ là mô tả và thăm dò.
Phân tích sẽ được tiến hành dựa trên quần thể ý định điều trị bao gồm tất cả các bệnh nhân
đã nhận được điều trị và có bất cứ thông tin có được trong theo dõi.
5
Ước lượng trung bình với một độ chính xác nhất định
Công thức để ước lượng trung bình của một biến số định lượng có độ lệch chuẩn là σ với sai
số d ở mức tin cậy (1-) là:
2
22
2/1d
Zn
Trong Stata, lệnh zmsampsi có thể sử dụng để tính cỡ mẫu nhằm ước lượng một trung bình
(package do Đỗ Văn Dũng viết). Cú pháp của lệnh zpsampi là:
zzmmssaammppssii,, ssdd((11)) eerrrroorr((00..11)) lleevveell((9955)) ddeessiiggnn((11))
Thí dụ: để ước lượng trung bình của trẻ sơ sinh đủ tháng sinh tại bệnh viện Hùng Vương
thành phố Hồ Chí Minh với sai số biên là 20 gram ở mức tin cậy 95% biết rằng độ lệch của
trọng lượng trẻ sơ sinh đủ tháng là 480 gram cần cỡ mẫu
.. zzmmssaammppssii,, ssdd((448800)) eerrrroorr((2200))
EEssttiimmaatteedd ssaammppllee ssiizzee ffoorr eessttiimmaattiinngg mmeeaann ffrroomm aa ddeessccrriippttiivvee ssttuuddyy
AAssssuummppttiioonnss::
SSDD == 448800
MMaarrggiinnaall EErrrroorr == 2200
AAllpphhaa == ..0055
LLeevveell ooff ccoonnffiiddeennccee == 9955%%
EEssttiimmaatteedd rreeqquuiirreedd ssaammppllee ssiizzee::
nn == 22221133
1. Chọn lựa sai số biên d
Không có quy tắc cứng nhắc độ chính xác d, điều này phụ thuộc vào mục tiêu của nghiên cứu
và vào tài nguyên hiện có. Thông thường sai số biên d phải đủ nhỏ để kết quả của nghiên cứu
có giá trị. Thí dụ nếu tại BV Hùng Vương trong năm vừa rồi đã có một nghiên cứu ước lượng
trung bình của trọng lượng trẻ sơ sinh đủ tháng với sai số biên 20 gram ở mức tin cậy 95% và
nếu không có cơ sở để cho rằng trọng lượng trung bình của trẻ sơ sinh đủ tháng thay đổi trên
50 gram thì nghiên cứu ước lượng trung bình của trọng lượng trẻ sơ sinh đủ tháng với sai số
biên 50 gram ở mức tin cậy 95% là ít có giá trị khoa học.
Đôi khi người ta không cho sai số d nhưng lại cung cấp giá trị trung bình giả thuyết
(hypothesized mean) và trung bình đòi hỏi (postulated mean). Khi đó sai số chính là trị tuyệt
đối của hiệu số trung bình giả thuyết và trung bình đòi hỏi.
Cỡ mẫu để kiểm định một giả thuyết
Trong nhiều nghiên cứu mục tiêu nghiên cứu là kiểm định giả thuyết. Thí dụ một nghiên cứu
có giả thuyết là nhóm sản phụ được dùng 600µg misoprostol ngay sau khi sinh để dự phòng
băng huyết sau sinh giảm nguy cơ băng huyết sau sinh so với nhóm sản phụ ở nhóm chứng.
Câu trả lời cho nghiên cứu này là có hay không. Và với câu trả lời nào thì cũng có khả năng
bị sai lầm. Nếu câu trả lời là có giảm nguy cơ trong khi thực sự là không giảm thì sai lầm này
được gọi là sai lầm loại 1 (type 1 error), nếu câu trả lời là không giảm nguy cơ trong khi thực
sự là có giảm thì sai lầm này được gọi là sai lầm loại 2. Chúng ta phải chọn cỡ mẫu sao cho
các xác suất sai lầm này là chấp nhận được và nghiên cứu là khả thi.
Xác suất sai lầm loại 1 còn được gọi là xác suất sai lầm alpha là xác suất nghiên cứu kết luận
là có sự khác biệt trong khi thực sự không có sự khác biệt (xác suất bác bỏ giả thuyết giả
thuyết Ho trong khi giả thuyết Ho đúng). Xác suất sai lầm loại 2 còn được gọi là xác suất sai
lầm beta là xác suất nghiên cứu kết luận là không có sự khác biệt trong khi thực sự có sự khác
biệt (xác suất chấp nhận giả thuyết giả thuyết Ho trong khi giả thuyết Ha đúng).
6
Bảng 1. Phân loại sai lầm theo kết luận của nghiên cứu so với chân lí khoa học
Chân lí là Ha đúng
(Thực sự có khác biệt)
Chân lí là Ho đúng
(Thực sự không khác
biệt)
Bác bỏ giả thuyết H0
(Kết luận có sự khác biệt)
Kết luận đúng
(Xác suất = 1- =
Power của nghiên cứu)
Sai lầm loại 1
(Xác suất = )
Không bác bỏ giả thuyết H0
(Kết luận không có sự khác biệt)
Sai lầm loại II
(Xác suất = )
Kết luận đúng
(Xác suất = 1-)
Để các cán bộ y tế dễ dàng liên hệ, có thể hình dung kết luận của một nghiên cứu tương tự
như kết luận của một xét nghiệm trong chẩn đoán bệnh nhân có mắc bệnh (Ha đúng) hay
không mắc bệnh (Ho đúng). Khi đó 1-β, còn được gọi là power của nghiên cứu, có ý nghĩa
tương tự như độ nhạy của test chẩn đoán, còn 1-α của nghiên cứu có ý nghĩa tương tự như
độ chuyên của test chẩn đoán. Hệ quả của phép tương tự này là:
- Nếu trong lâm sàng chúng ta sẽ không sử dụng test chẩn đoán nếu test này có độ nhạy và độ
chuyên kém thì chúng ta cũng sẽ không tiến hành nghiên cứu nếu nghiên cứu này có power
kém và xác suất sai lầm loại 1 cao.
- Nếu test chẩn đoán ra kết quả âm và chúng ta nhìn lại thấy độ nhạy của test chẩn đoán kém
thì chúng ta không thể bác bỏ được chẩn đoán. Tương tự như vậy, nếu kết luận của nghiên
cứu là không có sự khác biệt nhưng nếu chúng ta thấy power của nghiên cứu kém thì chúng
ta không thể cho rằng là 2 điều trị này là tương đương.
Vì vậy để tính cỡ mẫu cho nghiên cứu có mục tiêu kiểm định giả thuyết, trước tiên cần phải
xác định xác suất sai lầm loại 1 và power của nghiên cứu. Thông thường, xác suất sai lầm
loại 1 (alpha) được chọn ở mức ý nghĩa 5% và power thay đổi theo nguồn lực của nghiên
cứu nhưng thường power nên chọn từ 0,8 trở lên.
Kiểm định một giả thuyết, so sánh tỉ lệ của 2 nhóm
Giả sử chúng ta muốn so sánh hai tỉ lệ (thí dụ tỉ lệ trẻ em được bú sữa non trong hai nhóm bà
mẹ: một nhóm được giáo dục sức khỏe và một nhóm không). Chúng ta có thể kiểm định xem
hai tỉ lệnày có khác nhau đáng kể hay không, nói cách khác kiểm định xem hiệu số của hai tỉ
lệ này có khác một cách có ý nghĩa với zero hay không.
Ðể tính cỡ mẫu nhằm so sánh 2 tỉ lệ (trong trường hợp cỡ mẫu của 2 nhóm so sánh bằng
nhau), chúng ta ngoài mức alpha và power của nghiên cứu đã được quyết định, cần xác định
2 thông số sau dựa trên y văn hoặc theo phán đoán của nhà nghiên cứu
- Tỉ lệ 1 trong nhóm nền (thí dụ tỉ lệ có biến cố ở nhóm được sử dụng placebo)
- Tỉ lệ 2 trong nhóm quan tâm (thí dụ tỉ lệ có biến cố ở nhóm can thiệp)
Có hai công thức tính cỡ mẫu (cho mỗi nhóm) để so sánh hai tỉ lệ 1 và 2 của hai nhóm.
Một công thức có hiệu chỉnh cho tính liên tục của xấp xỉ bình thường của phân phối nhị thức
và công thức không hiệu chỉnh. Phần lớn phần mềm thống kê khi tính cỡ mẫu để so sánh 2 tỉ
lệ sử dụng công thức có hiệu chỉnh cho tính liên tục
Công thức tính cỡ mẫu ở nhóm đối chứng để so sánh 2 tỉ lệ không hiệu chỉnh cho tính liên tục
2
21
221112/1
1)(
)1()1()1()1(
R
RzRzn
Công thức tính cỡ mẫu ở nhóm đối chứng để so sánh 2 tỉ lệ có hiệu chỉnh cho tính liên tục
7
21
2
21
221112/1
1
1
)(
)1()1()1()1(
R
R
R
RzRzn
Trong đó:
α: mức ý nghĩa (hay xác suất sai lầm loại 1) của kiểm định
1-β: power của nghiên cứu thường được chọn là 80% hay 90%
1 Tỉ lệ có biến cố trong nhóm đối chứng
2 Tỉ lệ có biến cố trong nhóm quan tâm
: Tỉ lệ đáp ứng chung của 2 nhóm, R
R
1
21
với R là tỉ số của nhóm quan tâm trên nhóm đối chứng
Trong trường hợp cỡ mẫu nhóm nền bằng cỡ mẫu nhóm chứng thì R là 1 thì các công thức
tính cỡ mẫu ở trên sẽ trở thành:
Công thức tính cỡ mẫu so sánh 2 tỉ lệ có hiệu chỉnh cho tính liên tục
21
2
21
2
2/122111 2
)(
})1(2)1()1({
zzn
Công thức tính cỡ mẫu so sánh 2 tỉ lệ không hiệu chỉnh cho tính liên tục
2
21
2
2/122111
)(
})1(2)1()1({
zzn
Trong hai công thức này:
α: mức ý nghĩa (hay xác suất sai lầm loại 1 chấp nhận được
1-β: power của nghiên cứu.
1 Tỉ lệ có biến cố trong nhóm nền
2 Tỉ lệ có biến cố trong nhóm quan tâm
Để tính cỡ mẫu trong ngôn ngữ R sử dụng hàm n.for.2p (p1, p2, alpha = 0.05, power = 0.8,
ratio = 1); để tính cỡ mẫu trong phần mềm Stata, sử dụng lệnh sampsi #1 #2 , power(0.90)
alpha(0.05) ratio(1)
Thí dụ: Một nghiên cứu có giả thuyết là nhóm sản phụ được dùng 600µg misoprostol ngay
sau khi sinh để dự phòng băng huyết sau sinh giảm nguy cơ băng huyết sau sinh so với nhóm
sản phụ ở nhóm chứng. Giả định rằng tỉ lệ băng huyết sau sinh ở nhóm chứng là 10% và sử
dụng misoprostol làm giảm 50% nguy cơ bị băng huyết sau sinh tương ứng với tỉ lệ băng
huyết sau sinh ở nhóm can thiệp là 5%. Để có cỡ mẫu với power=96% và xác suất sai lầm
loại 1 alpha là 5%, cỡ mẫu cần thiết là được tính theo hàm n.for.2p của ngôn ngữ R là:
Để có cỡ mẫu với power=96% và xác suất sai lầm loại 1 alpha là 5%, cỡ mẫu cần thiết là
được tính theo lệnh sampsi của phần mềm R được tính như sau:
.. ssaammppssii 00..11 00..0055,, ppoowweerr((00..9966))
8
Kiểm định một giả thuyết cho kết cuộc định tính: các dạng đặc biệt
1- Cỡ mẫu cho nghiên cứu đoàn hệ
Để tính cỡ mẫu cho nghiên cứu đoàn hệ, ngoài α là xác suất sai lầm loại 1 và 1-β là power của
nghiên cứu còn cần 2 thông số sau:
- Tỉ lệ có biến cố ở nhóm không phơi nhiễm 1
- Tỉ số nguy cơ RR, từ đó ta tính được tỉ lệ có biến cố ở nhóm phơi nhiễm 2
Sau đó chúng ta có thể tính được cỡ mẫu cần thiết dựa trên công thức tính cỡ mẫu để so sánh
2 tỉ lệ:
Thí dụ: Một nghiên cứu đoàn hệ kéo dài trong 5 năm nhằm xác định mối liên quan giữa hút
thuốc lá và bệnh mạch vành tim ở đàn ông trên 50 tuổi. Giả sử ở người đàn ông trên 50 tuổi
không hút thuốc lá nguy cơ bị bệnh mạch vành tim trong 5 năm là 10% (1) và hút thuốc là
làm tăng nguy cơ bệnh mạch vành tim lên 2 lần (RR=2). Cỡ mẫu cần thiết cho nghiên cứu có
alpha=0,05 và power=90% được tính với hàm n.for.2p của ngôn ngữ R như sau:
Trong phần mềm Stata cũng có thể tính cỡ mẫu cho nghiên cứu đoàn hệ sử dụng lệnh
zesampsi
.. zzeessaammppssii 00..11,, rrrr((22))
AAssssuummppttiioonnss::
aallpphhaa == ..0055
ppoowweerr == ..99
RRiisskk aammoonngg nnoonn--eexxppoossee == ..11
EEssttiimmaatteedd rreeqquuiirreedd ssaammpplleess ssiizzee ffoorr ccoohhoorrtt ssttuuddyy wwiitthh RRRR== 22
NNuummbbeerr ooff eexxppoosseedd == 228866
NNuummbbeerr ooff uunneexxppoosseedd == 228866
9
Công thức tính cỡ mẫu ước ượng RR cho nghiên cứu đoàn hệ
Kí hiệu ε = ln(RRmin/RR)=1-RRmin/RR
LnRR=lnRR ± ε = lnRR ± 01
2/1
1111
NcNaZ =
lnRR ± 000111
2/1
1111
NpNNpNZ
= lnRR ± 11
11
01
2/1
ppN
Z
211
211
01
2/1
01
2/1
pp
ZN
ppN
Z
==>
2012
2
012
01
2
2
)1ln(
211
211
211
2/12/1
2/1
d
ppZ
ppZN
pp
ZN
ε = ln(RRmin/RR)
ε = ln[1- (RRmin-RR)/RR] = ln[1- εd]
với εd = (RRmin-RR)/RR là sai số tương đối
2- Cỡ mẫu cho nghiên cứu bệnh chứng
Để tính cỡ mẫu cho nghiên cứu đoàn hệ, ngoài α là xác suất sai lầm loại 1 và 1-β là power của
nghiên cứu còn cần 2 thông số sau:
- Tỉ lệ phơi nhiễm với yếu tố nguy cơ ở nhóm chứng 1 (1 cũng xấp xỉ bằng tỉ lệ phơi nhiễm
trong cộng đồng). Hiện nay có lưu hành một số tài liệu về tính cỡ mẫu trong đó đưa thí dụ về
tính cỡ mẫu cho nghiên cứu bệnh chứng nhưng dựa thông số tỉ lệ mắc bệnh trong cộng đồng
(chứ không phải là tỉ lệ phơi nhiễm trong cộng đồng) và điều này là không đúng với nguyên
tắc của nghiên cứu bệnh chứng.
- Tỉ số số chênh OR, từ đó ta tính được tỉ lệ phơi nhiễm với yếu tố nguy cơ ở nhóm bệnh 2.
)1()1(1 11
1
1
12
OR
OR
OR
OR
Sau đó chúng ta có thể tính được cỡ mẫu cần thiết dựa trên công thức tính cỡ mẫu để so sánh
2 tỉ lệ (đây là cách tiếp cận được sử dụng trong nhiều tài liệu về thống kê và trong các phần
mềm thống kê như StatDirect, EpiInfo,…)
Thí dụ: Một nghiên cứu bệnh chứng nhằm xác định mối liên quan giữa hút thuốc lá và bệnh
mạch vành tim ở đàn ông trên 50 tuổi. Mối liên hệ được xem là có ý nghĩa về y tế công cộng
10
khi OR>1,5. Giả sử tỉ lệ hút thuốc lá ở đàn ông trên 50 tuổi là 40%, ta có thể giả định tỉ lệ
hút thuốc lá cơ ở nhóm chứng 1 cũng là 40%. Khi đó tỉ lệ hút thuốc lá ở nhóm bệnh là 0,5 và
cỡ mẫu cần thiết là 538 người ở mỗi nhóm chứng và bệnh. Các lệnh để thực tính cỡ mẫu trên
ngôn ngữ R như sau: > 0.4*1.5/(1+0.4*0.5)
[1] 0.5
Vì công thức tính tỉ lệ phơi nhiễm ở nhóm bệnh cũng khó nhớ, do đó có một số tác giả (Đỗ
Văn Dũng) đã viết một số package để tính cỡ mẫu cho nghiên cứu bệnh chứng. Lệnh để tính
cỡ mẫu cho nghiên cứu bệnh chứng trong phần mềm Stata là zesampsi.
.. zzeessaammppssii 00..44,, oorr((11..55)) ppoowweerr((00..99)) aallpphhaa((00..0055)) rraattiioo((11))
AAssssuummppttiioonnss::
aallpphhaa == ..0055
ppoowweerr == ..99
PPrrooppoorrttiioonn ooff eexxppoosseedd aammoonngg ccoonnttrroollss == ..44
EEssttiimmaatteedd rreeqquuiirreedd ssaammppllee ssiizzeess ffoorr ccaassee--ccoonnttrrooll ssttuuddyy wwiitthh OORR== 11..55
NNuummbbeerr ooff ccaasseess == 553388
NNuummbbeerr ooff ccoonnttrroollss == 553388
Lưu ý: Mặc dù hiện nay có một số bài báo cáo sử dụng công thức khác để tính cỡ mẫu nhằm
xác định OR nhưng không trích dẫn tài liệu tham khảo và không đưa ra cơ sở lí luận để tính
cỡ mẫu. Ngoài ra khi sử dụng các công thức trên để tính toán cỡ mẫu thì kết quả là khác với
kết quả do các phần mềm thống kê thường dùng như Epi-Info, R đưa ra. Vì vậy cần thận
trọng khi sử dụng những công thức như vậy.
Bởi vì để kiểm định cho một phân phối có trung bình là μ và sai số chuẩn σ/√n
cần μ/(σ/√N) > Z1-α/2
Để đảm bảo với xác suất (1-β) hệ số μ/(σ/√N) > Z1-α/2 ta cần μ/(σ/√N) > (Z1-α/2+Z1-β)
nên cỡ mẫu tối thiểu
√N= (Z1-α/2 + Z1-β)*σ/μ
N= (Z1-α/2 + Z1-β)2*σ
2/μ
2
Do sai số chuẩn của lnOR là dcba
1111 =
0011 1
11
1
111
ppppN
=)1(
21
)1(
12
1
1
112
1
ppNppNppN
Nên công thức tính cỡ mẫu cho nghiên cứu bệnh chứng là (cho 1 nhóm)
)1()(ln
2 Z Z
)1(ln
2 Z Z
2
2
-1/2-1
2
2
-1/2-1ppORppOR
N
11
2
21
2
2/122111
)(
})1(2)1()1({
zzn
Thí dụ: Tỉ lệ hiện mắc của gẫy lún đốt sống trong quần thể là 25%. Muốn xác định ảnh hưởng
của hút thuốc lá lên gẫy lún đốt sống với tỉ số số chênh dự kiến là 2, với mức ý nghĩa là 5%
(kiểm định hai bên) và lực mẫu là 80%.
Với những thông tin trên không xác định được cỡ mẫu vì thông tin cho biết tỉ lệ hiện mắc của
gẫy lún đốt sống trong quần thể là tham số không có vai trò trong xác định cỡ mẫu. Muốn xác
định cỡ mẫu cần xác định tỉ lệ hút thuốc lá ở quần thể chung. Giả sử tỉ lệ hút thuốc lá trong
dân số chung là 40% thì ta sử dụng lệnh:
n.for.epi(0.4, OR=2 ,power=0.8,sided=2)
Cỡ mẫu cần thiết là 144 người cho mỗi nhóm
Nếu sử dụng công thức 9
(1+1)^2*(qnorm(0.975)+qnorm(0.8))^2/(log(2))^2/(1-0.5714286)/0.5714286
cỡ mẫu là 267 cho mỗi người
12
Công thức tính cỡ mẫu ước ượng OR cho nghiên cứu bệnh chứng
Kí hiệu ε = ln(ORmin/OR)=1-ORmin/OR
LnOR=lnOR ± ε = lnOR ± dcba
Z1111
2/1 =
lnOR ± )1(
11
)1(
11
00001111
2/1pNpNpNpN
Z
= lnOR ± )1(
11
)1(
11
0011
2/1
ppppN
Z
)1(
11
)1(
11
)1(
11
)1(
11
0011
2/1
0011
2/1
pppp
ZN
ppppN
Z
==>
200112
2
00112
0011
2
2
)1ln(
)1(
11
)1(
11
)1(
11
)1(
11
)1(
11
)1(
11
2/12/1
2/1
ppppZ
ppppZN
pppp
ZN
ε = ln(ORmin/OR) = ln(0.9) = -0.1053605
ε = ln[1- (ORmin-OR)/OR] = ln[1- εd]
với εd = (ORmin-OR)/OR
13
3a- Cỡ mẫu cho nghiên cứu theo dõi dọc sử dụng HR
Để tính cỡ mẫu do Schoenfeld đề xuất cho nghiên cứu theo dõi dọc sử dụng HR, ngoài α là
xác suất sai lầm loại 1 và 1-β là power của nghiên cứu còn cần 2 thông số sau:
- Tỉ lệ có biến cố ở nhóm không phơi nhiễm 1
- Tỉ số nguy hại HR (hazard ratio), từ đó ta tính được tỉ lệ có biến cố ở nhóm phơi nhiễm 2
Thí dụ 1: Một nghiên cứu đoàn hệ kéo dài trong 5 năm nhằm xác định mối liên quan giữa hút
thuốc lá và bệnh mạch vành tim ở đàn ông trên 50 tuổi. Giả sử ở người đàn ông trên 50 tuổi
không hút thuốc lá nguy cơ bị bệnh mạch vành tim trong 5 năm là 10% (1) và hút thuốc là
làm tăng nguy cơ bệnh mạch vành tim lên 2 lần (HR=2). Khi đó có 2 cách để tính cỡ mẫu:
3.1. Từ tỉ lệ có biến cố ở nhóm không phơi nhiễm 1 và HR tính tỉ lệ có biến cố ở nhóm phơi
nhiễm 2 = 1-exp(log(1-1) × HR) =0.19. Sử dụng công thức so sánh 2 tỉ lệ để tính cỡ mẫu
(Xem lại thí dụ ở phần cỡ mẫu cho nghiên cứu đoàn hệ). Cỡ mẫu cần thiết được ước đoán là
684 người.
3.2. Giả định tỉ số nhóm phơi nhiễm và nhóm không phơi nhiễm là 1:1. Khi đó tỉ lệ có biến số
chung ở 2 nhóm là = 1 × (1+HR)/2 = 14.5%. Sử dụng công thức sau để tính số biến cố cần
thiết ở nhóm can thiệp trong nghiên cứu sống còn
2
2
12/1)ln(
1)1()(
HRr
rZZE
21
2
2
12/1
1
)ln(
1)1()(
HRr
rZZN
Trong đó:
α: mức ý nghĩa (hay xác suất sai lầm loại 1 chấp nhận được
1-β: power của nghiên cứu.
r: Tỉ số nhóm chứng : nhóm can thiệp.
HR: Tỉ số nguy hại cần ước lượng
1 Tỉ lệ có biến cố trong nhóm được 15%
2 Tỉ lệ có biến cố trong nhóm phơi nhiễm được ước tính là 3%
HR: tỉ số nguy hại; HR=)1ln(
)1ln(
2
1
=0,187
Cỡ mẫu của nhóm chứng là N × m
Sử dụng hàm e.for.survival ta có thể tính được số biến cố chung cần thiết cho nghiên cứu
Sử dụng lệnh stpower cox của phần mềm Stata với cú pháp như sau,
.. ssttppoowweerr ccooxx,, ppoowweerr((00..99)) hhrraattiioo((22)) ffaaiillpprroobb((00..114455)) hhrr
EEssttiimmaatteedd ssaammppllee ssiizzee ffoorr CCooxx PPHH rreeggrreessssiioonn
WWaalldd tteesstt,, hhaazzaarrdd mmeettrriicc
HHoo:: [[bb11,, bb22,, ......,, bbpp]] == [[00,, bb22,, ......,, bbpp]]
IInnppuutt ppaarraammeetteerrss::
aallpphhaa == 00..00550000 ((ttwwoo ssiiddeedd))
hhrraattiioo == 22..00000000
ssdd == 00..55000000
ppoowweerr == 00..99000000
14
PPrr((eevveenntt)) == 00..11445500
EEssttiimmaatteedd nnuummbbeerr ooff eevveennttss aanndd ssaammppllee ssiizzee::
EE == 8888
NN == 660044
Như vậy khi thực hiện nghiên cứu cần quan sát được 88 biến cố xảy ra. Và để có 88 biến cố
xảy ra trong vòng 5 năm cần có 302 người trong mỗi nhóm. Tổng số người đưa vào nghiên
cứu là 604 người.
Thí dụ 2: Một nhà nghiên cứu muốn so sánh hiệu quả của một loại điều trị so với placebo
với kết cuộc chính là thời điểm xuất hiện nhiễm trùng với mức ý nghĩa 2 bên 0,05 và power
là 90%. Ông ta muốn theo dõi bệnh nhân trong vòng 1 năm và ông ta mong đợi ở nhóm
placebo có 40% bệnh nhân bị nhiễm trùng và ở nhóm điều trị có 20% bệnh nhân bị nhiễm
trùng. Cỡ mẫu cần thiết được tính theo công thức:
Như vậy cần theo dõi tổng số 62 biến cố. Số người cần theo dõi ở cả 2 nhóm là:
62/(0.2/2+0.4/2) = 206.
Như vậy nghiên cứu cần đưa vào 103 bệnh nhân vào nhóm placebo và 103 bệnh nhân vào
nhóm can thiệp.
3b- Cỡ mẫu cho nghiên cứu theo dõi dọc phép kiểm log rank
Đây là nghiên cứu đoàn hệ với kết cuộc là biến số thời gian xảy ra biến cố nên nghiên cứu sử
dụng công thức của Friedman [1] xác định tổng số biến cố:
2
21
2
12/11
11}{
HR
HRzzn
Nếu tỉ số cỡ mẫu giữa 2 nhóm ratio khác với một thì có thể tính số biến cố cho từng nhóm
như sau:
ratioratioHR
ratioHRzze
)1(
1
1
1*}{2
2
2
12/1
2
21
2
12/11
1*1}{
HR
ratioHRzzn
Trong đó
α: mức ý nghĩa (hay xác suất sai lầm loại 1) chấp nhận được chọn là 0,05
1-β: power của nghiên cứu được chọn là 80%
1 Tỉ lệ có biến cố trong nhóm được 15%
2 Tỉ lệ có biến cố trong nhóm phơi nhiễm được ước tính là 3%
HR: tỉ số nguy hại; HR=)1ln(
)1ln(
2
1
=0,187
Từ công thức tính cỡ mẫu trên ta có được số biến cố cần thiết là 12 trường hợp và tổng số
bệnh nhân cần cho nghiên cứu là 125 bệnh nhân.
Đây là nghiên cứu đoàn hệ với kết cuộc là biến số thời gian xảy ra biến cố nên nghiên cứu sử
dụng công thức của Friedman:
15
2
2
12/1)ln(
1)1()(
HRr
rZZE
21
2
2
12/1
1
)ln(
1)1()(
HRr
rZZN
Trong đó:
α: mức ý nghĩa (hay xác suất sai lầm loại 1 chấp nhận được
1-β: power của nghiên cứu.
r: Tỉ số nhóm chứng : nhóm can thiệp.
HR: Tỉ số nguy hại cần ước lượng
1 Tỉ lệ có biến cố trong nhóm được 15%
2 Tỉ lệ có biến cố trong nhóm phơi nhiễm được ước tính là 3%
HR: tỉ số nguy hại; HR=)1ln(
)1ln(
2
1
=0,187
Từ công thức tính cỡ mẫu trên ta có được số biến cố cần thiết là 12 trường hợp và tổng số
bệnh nhân cần cho nghiên cứu là 125 bệnh nhân.
4- Cỡ mẫu để so sánh các tỉ lệ nhỏ
Các công thức tính cỡ mẫu ở trên khi n×p ≥ 5 và n×(1-p) ≥ 5. Khi các điều kiện trên không
thỏa thì phân phối nhị thức không xấp xỉ tốt với phân phối bình thường. Khi đó để tính cỡ
mẫu, sử dụng công thức tính cỡ mẫu với phép biến đổi góc (angular transformation). Một ưu
điểm khác của phép biến đổi góc arcsine có ưu điểm là có phương sai không phụ thuộc vào
ước lượng của tham số p. Công thức để tính cỡ mẫu so sánh các tỉ lệ nhỏ là:
2
1
2
2/1
)2arcsin(arcsin2
)(
ZZN
Thí dụ: một nghiên cứu so sánh 2 tử vong sau 30 ngày trong 2 phương pháp cách điều trị tắc
mật do bệnh lí ác tính bằng cách sử dụng cầu nối (bypass) hoặc đặt stent. Tỉ lệ tử vong trong
30 ngày của phương pháp sử dụng cầu nối là 20% và của phương pháp đặt stent được ước
đoán là 5%. Cỡ mẫu cần thiết là 115 người cho mỗi nhóm.
5- Cỡ mẫu để ước lượng tần suất biến cố ngoại ý hiếm
Trong các loại thử nghiệm lâm sàng có một loại thử nghiệm lâm sàng được gọi là thử nghiệm
tính an toàn mở rộng (Expanded Safety trials). Thử nghiệm tính an toàn mở rộng là thử
nghiệm lâm sàng giai đoạn 4 được thiết kế nhằm để ước lượng tần suất của các biến cố hiếm
mà chưa được phát hiện ở các nghiên cứu trước đó. Những nghiên cứu này thường là nghiên
cứu không ngẫu nhiên.
Trong loại nghiên cứu này người ta thường giả định quần thể nghiên cứu lớn, xác suất của
biến cố ngoại ý là nhỏ và mọi đối tượng được theo dõi ở thời gian xấp xỉ bằng nhau. Bởi vì
các giả định này chúng ta có thể mô hình hóa xác suất có x biến cố xảy ra dựa theo hàm xác
suất Poisson.
!)(
x
exXf
x
Để phát hiện được biến cố xảy ra nghiên cứu phải có cỡ mẫu đủ lớn để xác suất β cao phát
hiện ít nhất một biến cố ngoại ý (với xác suất xảy ra biến cố ở 1 bệnh nhân là p)
16
β=P(X≥1)=1-P(X=0)= pN
x
eex
e
11!
1
Điều này có nghĩa là cỡ mẫu phải lớn hơn:
pN
pN
)1ln(
)1ln(
Thí dụ: một công ty dược phẩm dự định tiến hành một thử nghiệm an toàn mở rộng (ES trial)
cho một thuốc chống loạn nhịp mới. Công ty muốn xác định một đoàn hệ để theo dõi trong 2
năm biến chứng nhồi máu cơ tim ở bệnh nhân. Công ty muốn có xác suất 99% phát hiện được
nguy cơ có biến chứng nhồi máu cơ tim 1/1000. Cỡ mẫu cần thiết là 4606.
Kiểm định một giả thuyết, so sánh trung bình của 2 nhóm
Bởi vì để kiểm định cho một phân phối có trung bình là μ và sai số chuẩn σ/√n
cần μ/(σ/√N) > Z1-α/2
Để đảm bảo với xác suất (1-β) hệ số μ/(σ/√N) > Z1-α/2 ta cần μ/(σ/√N) > (Z1-α/2+Z1-β)
nên cỡ mẫu tối thiểu
√N= (Z1-α/2 + Z1-β)*σ/μ
N= (Z1-α/2 + Z1-β)2*σ
2/μ
2
Vì vậy công thức để tính cỡ mẫu nhằm so sánh trung bình của 2 nhóm (nhóm 1 có trung bình
giả thuyết là μ1 và độ lệch chuẩn là σ1 ; nhóm 2 có trung bình giả thuyết là μ2 và độ lệch
chuẩn là σ2)
2
21
2
2
2
1
2
2/11
)(
)()(
zzn
Để tính cỡ mẫu cho nghiên cứu kiểm định giả thuyết so sánh 2 trung bình, có thể sử dụng
hàm n.for.2means trong ngôn ngữ R để hoặc lệnh sampsi trong phần mềm Stata.
n.for.2means (mu1, mu2, sd1, sd2, ratio = 1, alpha = 0.05, power = 0.8)
Đôi khi người ta không cung cấp các hiệu số sự khác biệt mà cung cấp hiệu số sự khác biệt
chia cho độ lệch chuẩn. Con số này được gọi là cỡ của tác động (effect size) d. Khi đó công
thức tính cỡ mẫu là:
2
2
2/11 2)(
d
zzn
Kiểm định một giả thuyết, so sánh trung bình của 1 nhóm trước và sau can thiệp
Công thức để tính cỡ mẫu nhằm so sánh trung bình của 1 nhóm trước và sau can thiệp (với
hiệu quả can thiệp d=µ1- µ2) và độ lệch chuẩn của hiệu quả can thiệp là σ như sau:
2
22
2/11
2
21
22
2/11 )(
)(
)(
d
zzzzn
Để tính cỡ mẫu cho nghiên cứu kiểm định giả thuyết so sánh 2 trung bình, có thể sử dụng
lệnh sampsi trong phần mềm Stata.
Thí dụ:
Một nghiên cứu thử đánh giá hiệu quả của một loại thuốc hạ áp trên bệnh nhân cao huyết áp.
17
Nhà nghiên cứu ước đoán huyết áp trước điều trị trung bình là 150 mmHg sẽ giảm còn 140
mmHg và độ lệch chuẩn của mức độ giảm huyết áp là 30mmHg. Cỡ mẫu cần thiết với lực
mẫu là 80% và mức ý nghĩa là 5% (hai bên)
Kiểm định ý nghĩa của hệ số tương quan một mẫu
Hệ số tương quan r không có phân phối bình thường, vì vậy muốn xác định cỡ mẫu cho hệ số
tương quan người ta phải sử dụng phép biến đổi z kinh điển của Fisher:
r
rz
1
1log5.0
z có phân phối bình thường với độ lệch chuẩn là N-3
Vì vậy để kiểm định hệ số tương quan r1 có khác biệt có ý nghĩa với hệ số tương quan r2
(tham số từ quần thể), chúng ta sử dụng công thức tính cỡ mẫu:
3
)()(
)(2
01
2
2/11
rzrz
zzn
với
1
11
1
1log5.0)(
r
rrz
và
2
22
1
1log5.0)(
r
rrz
Thí dụ
Thí dụ 1: Trong sinh lí học hô hấp, giả định rằng sự tương quan giữa thể tích thở ra gắng sức
trong một giây đầu tiên (FEV1) và dung tích sống gắng sức (FVC) ở người khỏe mạnh là 0,6.
Giả sử có một nhóm bệnh nhân bệnh hô hấp khám tại phòng khám Bệnh viện Đại học Y dược
và nhà nghiên cứu muốn kiểm dịnh có sự tương quan giữa FEV1 và FVC ở những bệnh nhân
này hay không. Do chúng ta không mong đơi có sự tương quan dương, vì vậy kiểm định là ở
một bên với mức ý nghĩa là 5% và power 80%. Cỡ mẫu cần thiết được tính như nhau: (David
Machin, 1997)
Chúng ta cần tối thiểu 16 người, mỗi người được đo lường cả FEV1 và FVC để kiểm định
giả thuyết có sự tương quan giữa FEV1 và FVC ở mức ý nghĩa một bên của alpha= 0.05 và
power=0.6
Thí dụ 2: Nếu bệnh nhân bị tăng huyết áp nhẹ được sử dụng một loại thuốc, huyết áp giảm
xuống có liên qian đến giảm độ nhớt của máu với hệ số tương quan là 0,3. Giả sử chúng ta
tiến hành thử nghiệm tương tự với bệnh nhân tăng huyết áp nặng và quan sát được sự giảm
huyết áp và giảm độ nhớt sau khi uống thuốc. Số bệnh nhân cần được khảo sát để có hệ số
tương quan có ý nghĩa thống kê, nếu độ lớn của hệ số tương quan được ước đoán là 0,3.
(David Machin, 1997)
Trong trường hợp này chúng ta không rõ tương quan sẽ đi theo hướng nào va có thể có tương
quan dương hay âm, vì vậy chúng ta quyết định sử dụng kiểm định 2 đuôi với mức ý nghĩa
5% và power 90%. Ta tính được số đối tượng nghiên cứu cần thiết là 113 người.
Thí dụ 3: Một nhà tâm lí học muốn tiến hành một thực nghiệm, trong đó sinh viên được hỏi
những câu hỏi để đo lường nhân cách (personality) và sự mong muốn xã hội (social
desirability). Nhà nghiên cứu muốn chứng tỏ rằng hai biến số này không có liên quan. Cần
nghiên cứu trên bao nhiêu sinh viên (David Machin, 1997)
Đầu tiên cần chỉ ra mức ý nghĩa của sai lầm loại 1 alpha. Trong tình huống này, nhà nghiên
18
cứu muốn giả định rằng hệ số tương quan bằng 0 khi hệ số tương quan này nhỏ và như vậy
chọn ngưỡng sai lầm loại 1 lớn là 0,2. Tuy nhiên ông ta muốn có sai lầm loại 2 tương đối nhỏ
và chọn beta=0,05. Ngoài ra nhà nghiên cứu muốn đặt giá trị của r mà nếu hệ số tương quan
nhỏ hơn số này thì xem như sự tương quan trên thực tế bằng không và ông ta đặt giá trị này là
0,1. Vì vậy số lượng sinh viên cần thiết là 854.
Thí dụ 4: Hệ số tương quan của 2 biến số được ước đoán là 0,6. cần bao nhiêu bệnh nhân để
hệ số tương quan này là có ý nghĩa thống kê (so với 0,0). Mức ý nghĩa được chọn là 0.05 và
lực mẫu là 0.90 (medCalc) ta có cỡ mẫu cần thiết là 25 người
Thí dụ 4: Hệ số tương quan của 2 biến số được ước đoán là 0,6. cần bao nhiêu bệnh nhân để
hệ số tương quan này là khác biệt có ý nghĩa thống kê so với ρ=0,2. Mức ý nghĩa được chọn
là 0.05 và lực mẫu là 0.90 ()
Như vậy, cần phải khảo sát 47 bệnh nhân. Kết quả này đã được kiểm chứng lại phần mềm
Sisa (http://www.quantitativeskills.com/sisa/statistics/correl.htm) và phần mềm StudySize 2.0
(Bertile Olofsson).
Kiểm định ý nghĩa của hệ số tương quan của hai mẫu
Đôi khi chúng ta cần so sánh hệ số tương quan r1 không phải với hệ số tương quan cho trước
(tham số của dân số) mà cần so sánh hệ số tương quan r1 ở một nhóm quần thể này với hệ số
tương quan r2 một nhóm quần thể khác. Khi đó cỡ mẫu cần thiết cho mỗi nhóm được tính
theo công thức sau
3
)()(
)(2
2
01
2
2/11
rzrz
zzn
với
1
11
1
1log5.0)(
r
rrz
và
2
22
1
1log5.0)(
r
rrz
Thí dụ: Nếu bệnh nhân bị tăng huyết áp nhẹ được sử dụng một loại thuốc, huyết áp giảm
xuống có liên quan đến giảm độ nhớt của máu với hệ số tương quan là 0,3 (r2=0,3). Giả sử
chúng ta tiến hành thử nghiệm tương tự với bệnh nhân tăng huyết áp nặng và mong đợi quan
sát được sự tương quan mạnh hơn giữa giảm huyết áp và giảm độ nhớt sau khi uống thuốc
(r1=0.5). Số bệnh nhân cần khảo sát để chứng tỏ sự khác biệt giữa hệ số tương quan ở nhóm
bệnh nhân tăng huyết nặng (r1=0.5) và hệ số tương quan bệnh nhân tăng huyết áp nhẹ (r2=0,3)
có thể được tính được cỡ mẫu cho cả 2 nhóm là 738 người.
Kết quả này đã được kiểm chứng trên phần mềm StudySize 2.0 (Bertile Olofsson).
Các điểm cần lưu ý trong tính cỡ mẫu
- Như đã nói ở trên, cách tính cỡ mẫu chỉ cho chúng ta một ước lượng thô của cõ mẫu cần
19
thiết bởi vì nó dựa trên sự ước đoán về giá trị của thông số, quyết định chủ quan của chúng ta
về hậu quả mà chúng ta muốn phát hiện và công thức được sử dụng là công thức gần đúng.
Do đó con số tính ra giúp chúng ta phân biệt giữa cỡ mẫu 50 và 100 chứ không phân biệt cỡ
mẫu 50 và 53.
- Chúng ta phải cân đối giữa điều chúng ta mong muốn và tính khả thi. Ðôi khi có thể dùng
công thức tính cỡ mẫu để đi ngược lại năng lực của nghiên cứu. Thí dụ nếu chúng ta có một
kinh phí hạn chế để thực hiện một nghiên cứu nên chỉ có một cỡ mẫu nhất định. Chúng ta có
thể tính ngược lại từ cỡ mẫu để biết năng lực của nghiên cứu. Nếu hóa ra năng lực của nghiên
cứu rất thấp (thí dụ như 20%) tốt nhất chung ta không nên tiến hành nghiên cứu vì chúng ta
đã nắm chắc kết quả thất bại.
- Nếu một nghiên cứu có nhiều mục tiêu thì cỡ mẫu đủ cho một mục tiêu này có thể không đủ
cho mục tiêu khác. Ðể tính cỡ mẫu, tốt nhất phải chú trọng vào biến số (hoặc những biến số
quan trọng nhất).
- Tính cỡ mẫu không khó, cái khó là phải cung cấp những giả định của nghiên cứu: sai lầm
loại một, năng lực, sự khác biệt mà chúng ta muốn phát hiện.
Bài tập:
Thí dụ 1: Cho một nghiên cứu bệnh chứng, sử dụng những giả định sau để tính cỡ mẫu
cho từng trường hợp
Năng lực của nghiên cứu = 90%; mức ý nghĩa = 5%; 1 bệnh cho một chứng
% chứng tiếp xúc với yếu tố nguy cơ
OR 5% 20% 50% 70% 90%
1.5 2346
2 244
5 46
10 50
1. Dựa trên phép tính cỡ mẫu hãy đưa ra khuyến cáo khi nào nên dùng nghiên cứu bệnh
chứng và khi nào không.
2. Hãy tính cỡ mẫu trong một nghiên cứu bệnh chứng có năng lực =90%, mức ý nghĩa =5%
OR= 2 và tỉ lệ tiếp xúc với yếu tố nguy cơ là 30%. Hãy tính cỡ mẫu khi có 1 chứng: 1 bệnh; 2
chứng: 1 bệnh; 3 chứng: 1 bệnh.
Thí dụ 2: Cho một nghiên cứu đoàn hệ, sử dụng những giả định sau để tính cỡ mẫu cho
từng trường hợp
Năng lực của nghiên cứu = 90%; mức ý nghĩa = 5%; nhóm có tiếp xúc= nhóm không tiếp
xúc
tỉ suất mắc bệnh trong nhóm không tiếp xúc với yếu tố nguy cơ
RR 0,1% 1% 5% 15% 30%
1.5 108,904
2 3300
3 207
5 15
1. Dựa trên phép tính cỡ mẫu hãy đưa ra khuyến cáo khi nào nên dùng nghiên cứu đoàn hệ và
khi nào không.
20
2. Hãy tính cỡ mẫu trong một nghiên cứu bệnh chứng có năng lực =90%, mức ý nghĩa =5%
OR= 2 và tỉ suất mắc bệnh là 5%. Hãy tính cỡ mẫu khi có nhóm không tiếp xúc = nhóm tiếp
xúc; nhóm không tiếp xúc = 2 nhóm tiếp xúc; nhóm không tiếp xúc = 3 nhóm tiếp xúc
Thí dụ 3: Phòng y tế huyện A. muốn kiểm tra báo cáo về tỉ lệ tiêm chủng của một xã là
80% bằng cách tiến hành một cuộc điều tra (với sai số tuyệt đối dưới 5%, độ tin cậy = 95%).
Nếu phòng y tế quyết định chọn mẫu bằng phương pháp chọn mẫu ngẫu nhiên thì cỡ mẫu cần
thiết là bao nhiêu? Nếu chọn theo cụm thì cỡ mẫu cần thiết là bao nhiêu?