Cách tính cỡ mẫu - · PDF file3 tỉ lệ p! Toàn bộ logic của vấn đề là ở chỗ chúng ta có thể ước đoán p trước lúc nghiên cứu một cách không

1

Cách tính cỡ mẫu

Mục tiêu

Sau khi nghiên cứu bài này, hội thảo viên có khả năng:

(i) Phân biệt hai cách tiếp cận trong cách tính cỡ mẫu: ước lượng tham số hay kiểm định giả

thuyết

(ii) Trình bày công thức tính toán cỡ mẫu để ước lượng một tỉ lệ, ước lượng một trung bình,

so sánh 2 tỉ lệ và so sánh 2 trung bình

(iii) Sử dụng phần mềm Stata để tính toán cỡ mẫu cho một nghiên cứu cụ thể

Giới thiệu

Trong nghiên cứu khoa học, có 2 loại câu hỏi nghiên cứu. Loại thứ nhất: quy mô của vấn đề

là lớn hay nhỏ, số đo liên quan của 2 biến số là lớn hay nhỏ. Loại thứ hai: Có hay không sự

khác biệt của quy mô vấn đề giữa các nhóm hoặc có hay không sự liên quan giữa các nhóm.

Loại câu hỏi nghiên cứu thứ nhất được trả lời bằng một con số trong khi loại câu hỏi nghiên

cứu thứ hai được trả lời là có hay không. Do có hai loại câu hỏi nghiên cứu, chúng ta có 2

cách tiếp cận trong cách tính cỡ mẫu.

Hai cách tiếp cận trong tính cỡ mẫu

Trên cơ bản có hai cách tiếp cận trong tính cỡ mẫu:

(a) tính cỡ mẫu để ước lượng của một tỉ lệ, một trung bình, hiệu số, nguy cơ tương đối

với một mức độ chính xác nhất định. Thí dụ, để ước lượng tỉ lệ trẻ em trong lứa từ

12-23 tháng tuổi được tiêm chủng đầy đủ (với độ chính xác) trong vòng 10%. Thông

tin chìa khóa để tính cỡ mẫu cho ước lượng một tham số là chúng ta chấp nhận sai số

tối đa cho phép là bao nhiêu. Nếu chấp nhận sai số tối đa cho phép lớn thì cỡ mẫu cần

thiết sẽ nhỏ đi và ngược lại, nếu chấp nhận sai số tối đa cho phép nhỏ thì cỡ mẫu cần

thiết sẽ phải lớn.

(b) tính cỡ mẫu để kiểm định giả thuyết. Thí dụ, so sánh thời gian bú sữa mẹ hoàn

toàn ở 2 nhóm có giáo dục sức khỏe và nhóm chứng hoặc tỉ lệ bị xuất huyết sau sinh ở

2 nhóm phụ nữ, nhóm can thiệp được dùng thuốc co cơ tử cung để dự phòng xuất

huyết sau sinh và nhóm chứng không được dùng thuốc co cơ tử cung để dự phòng.

Thông tin chìa khóa để tính cỡ mẫu cho kiểm định giả thuyết là chúng ta chấp nhận

xác suất mắc sai lầm trong kiểm định giả thuyết nghiên cứu là bao nhiêu? Nếu chúng

ta chấp nhận xác suất mắc sai lầm lớn thì chúng ta chỉ cần cỡ mẫu nhỏ, ngược lại, nếu

chúng ta muốn xác suất mắc sai lầm nhỏ thì cỡ mẫu cần thiết sẽ phải lớn.

Vấn đề xác định cỡ mẫu trong nghiên cứu khoa học là một vấn đề quan trọng. Nếu chúng ta

lấy một cỡ mẫu quá lớn thì chúng ta rõ ràng lãng phì tiền bạc và thời gian. Nếu chúng ta lấy

mẫu quá nhỏ thì kết quả của nghiên cứu sẽ không có độ chính xác mong muốn (trong trường

hợp nghiên cứu để ước lượng) hoặc có xác suất mắc sai lầm lớn (trong trường hợp nghiên

cứu để so sánh hay kiểm định) thì nghiên cứu sẽ không có giá trị khoa học và như vậy công

trình nghiên cứu đó cũng là một sự lãng phí.

Khái niệm về sai số biên (marginal error)

Giả sử tôi đo một chiếc bàn dài 90 cm và trong 10 lần đo lường tôi bị sai số là 1 cm, 3 cm, 4

cm, 7 cm, 2 cm, 5 cm, 6 cm, 0 cm, 2 cm, 3 cm. Ở các lần đo có sai số khác nhau nhưng sai số

không bao giờ vượt quá 7 cm thì tôi gọi sai số biên là 7cm.

Tuy nhiên có trường hợp tôi không thể khẳng định chắc chắn về sai số biên nhưng nếu tôi

biết khẳng định sai số đo lường không vượt quá 7 cm có khả năng đúng là 0.95 thì tôi thì kết

2

luận sai số biên là 7cm với mức tin cậy là 95%.

Nếu tôi không biết chiều dài của chiếc bàn nhưng nếu tôi đo được chiếc bàn là 100 cm và

phương pháp do của tôi có sai số biên là 7cm với mức tin cậy là 95%. Tôi kết luận rằng

khẳng định chiều dài thật của chiếc bàn nằm trong khoảng từ 93 cm đến 107 cm có khả năng

đúng đến 95%.

Cỡ mẫu để ước lượng tham số

Ước lượng một tỉ lệ với một sai số biên cho trước

Công thức tính cỡ mẫu cho ước lượng một tỉ lệ p với sai số biên d ở mức tin cậy (1-) của là:

2

2

2/1

)1(

d

ppZn

Trong đó Z1-α/2 là phân vị của phân phối chuẩn bình thường (standard normal distribution) tại

1-α/2. Nếu chúng ta muốn tính cỡ mẫu ở mức tin cậy 95% thì α=0.05 và Z1-α/2 = Z0.975 = 1,96

Phân vị của phân phối chuẩn bình thường ở các mức tin cậy khác có thể tìm bằng cách tra

bảng của phân phối chuẩn bình thường hoặc sử dụng hàm qnorm() trong ngôn ngữ R, hàm

invnormal() trong phần mềm Stata hoặc hàm NORMSINV() của phần mềm Excel.

Thí dụ: Một nghiên cứu về hiệu quả điều trị của tenofovir trên bệnh nhân viêm gan B mạn

tính ở một bệnh viện muốn ước lượng tỉ lệ bệnh nhân có lượng HBV DNA > 105 copies/ml

máu trở thành HBV DNA âm tính ở tháng thứ 12 với sai số biên cho phép d=6% ở mức tin

cậy 95%. Tỉ lệ chuyển âm của HBV DNA sau 12 tháng điều trị với tenofovir ở bệnh nhân

viêm gan B mạn tính bệnh viện đó là chưa biết (vì vậy mới cần làm nghiên cứu này) nhưng tỉ

lệ này được báo cáo từ các nghiên cứu trên quần thể bệnh nhân tương tự gợi ý p=40% là phán

đoán hợp lí nhất. Cỡ mẫu cần thiết cho nghiên cứu này là:

1.2560036.0

24.0842.3

06.0

6.04.096.1

)1(2

2

2

2

2/1

d

ppZn

Vì cỡ mẫu phải là số nguyên nên chúng ta làm tròn lên và chọn cỡ mẫu là 257.

Trong Stata, lệnh zpsampsi có thể sử dụng để tính cỡ mẫu nhằm ước lượng tỉ lệ (package do

Đỗ Văn Dũng viết). Cú pháp của lệnh zpsampi là:

zzppssaammppssii,, pprrooppoorrttiioonn((00..55)) eerrrroorr((00..11)) lleevveell((9955)) ddeessiiggnn((11))

Áp dụng lệnh zpsampsi trong trường hợp tỉ lệ ước đoán p=0.4 và sai số biên d=0.06 ta có cỡ

mẫu cần thiết

.. zzppssaammppssii,, pprrooppoorrttiioonn((00..44)) eerrrroorr((00..0066))

EEssttiimmaatteedd ssaammppllee ssiizzee ffoorr eessttiimmaattiinngg pprrooppoorrttiioonn ffrroomm aa ddeessccrriippttiivvee ssttuuddyy

AAssssuummppttiioonnss::

pp == ..44

MMaarrggiinnaall eerrrroorr == ..0066

DDeessiiggnn eeffffeecctt == 11

AAllpphhaa == ..0055

LLeevveell ooff ccoonnffiiddeennccee == 9955%%

EEssttiimmaatteedd rreeqquuiirreedd ssaammppllee ssiizzee::

nn == 225577

1- Ước đoán tỉ lệ p

Một thắc mắc hay nẩy sinh trong khi nghiên cứu công thức này là trong khi chúng ta muốn

nghiên cứu ước lượng p nhưng trong khi tính toán để tính cỡ mẫu chúng ta phải có giá trị của

3

tỉ lệ p! Toàn bộ logic của vấn đề là ở chỗ chúng ta có thể ước đoán p trước lúc nghiên cứu

một cách không chính xác, sau nghiên cứu chúng ta có thể ước lượng p một cách chính xác

hơn nhiều. Ta có thể ước đoán p sử dụng những nghiên cứu trước đó (chọn lựa nghiên cứu

nào phù hợp nhất về thời gian nghiên cứu, về quần thể nghiên cứu), sử dụng nghiên cứu dẫn

đường, sử dụng ý kiến chuyên gia hay phán đoán cá nhân.

Nếu chúng ta không thể ước đoán một giá trị cụ thể của p, chúng ta có thể ước đoán một

khoảng giá trị của p. Thí dụ mặc dù chúng ta không biết tỉ lệ trẻ dưới 5 tuổi ở một tỉnh bị suy

dinh dưỡng là bao nhiêu, chúng ta có thể ước đoán tỉ lệ trẻ dưới 5 tuổi bị suy dinh dưỡng ở

tính đó nằm trong khoảng từ 10% đến 30%. Khi đó, chúng ta chọn p ước đoán để đưa vào

công thức tính cỡ mẫu là giá trị gần với 50%. Trong trường hợp cụ thể này, chúng ta chọn p

ước đoán để đưa vào công thức tính cỡ mẫu là 30%.

Trong trường hợp chúng ta không thể ước đoán p và cho rằng p có thể thay đổi từ 0% đến

100%, ta có thể ước đoán p =0,5, vì ở tỉ lệ ước đoán này tương ứng với cỡ mẫu lớn nhất (do

đó có tính chất an toàn nhất).

2. Chọn lựa sai số biên d

Không có quy tắc cứng nhắc độ chính xác d, điều này phụ thuộc vào mục tiêu của nghiên cứu

và vào tài nguyên hiện có. Thông thường sai số biên d phải đủ nhỏ để kết quả của nghiên cứu

có thể giúp chúng ta ra quyết định hoặc giúp chúng ta phát hiện khuynh hướng thay đổi.

Nhưng sai số biên không được quá nhỏ làm ảnh hưởng đến tính khả thi của nghiên cứu.

Trong trường hợp chưa có nhiều thông tin, một quy tắc xác định sai số biên được tác giả

Virasakdi Chongsuvivatwong đề xuất:

- Nếu tỉ lệ p từ 0,3 đến 0,7; sai số biên là 10%

- Nếu tỉ lệ p từ 0,1 đến <0,3 hoặc tỉ lệ p >0,7 đến 0.9: sai số biên là 5%

- Nếu tỉ lệ p <0,1: sai số biên là p/2

- Nếu tỉ lệ p>0.9: sai số biên là (1-p)/2

Đôi khi người ta không cho sai số d nhưng lại trình bày bài toán bằng cách đưa tỉ lệ giả thuyết

(hypothesized proportion) và tỉ lệ đòi hỏi (postulated proportion). Thí dụ một nghiên cứu

muốn khảo sát tỉ lệ tiêm chủng đủ ở trẻ em dưới 2 tuổi và ước đoán tỉ lệ tiêm chủng đủ là

80% nhưng đòi hỏi tỉ lệ tiêm chủng đủ phải lớn hơn 75% (Nếu tỉ lệ tiêm chủng đủ dưới 75%

là xem như chương trình tiêm chủng không đạt yêu cầu). Khi đó ta tính công thức xác định

cỡ mẫu với tỉ lệ ước đoán là tỉ lệ giả thuyết=80%, sai số biên là trị tuyệt đối của hiệu số tỉ lệ

giả thuyết và tỉ lệ đòi hỏi, d=5% với mức tin cậy 95%. Cỡ mẫu cần thiết là:

3. Hiệu chỉnh cho nghiên cứu với phương pháp lấy mẫu cụm

- Công thức được trình bày là dành cho phép lấy mẫu ngẫu nhiên đơn. Nếu nghiên cứu sử

dụng phương pháp lấy mẫu cụm cần phải hiệu chỉnh tác động làm giảm độ chính xác của việc

chọn cụm bằng cách tăng cỡ mẫu. Cỡ mẫu trong nghiên cứu lấy mẫu cụm thường được nhân

lên với một hệ số (được gọi là hệ số thiết kế) có giá trị từ 2 đến 4. Khi đó công thức tính cỡ

mẫu để ước lượng tỉ lệ là:

2

2

2/1

)1(

d

ppZCn

Với C là hệ số thiết kế.

Hệ số thiết kế thấp nếu biến cố phân bố tương đối đồng đều trong quần thể. Hệ số thiết kế cáo

nếu biến cố có tính chất tập trung ở một số khu vực trong quần thể. Thí dụ nghiên cứu về tỉ lệ

của nhóm máu sẽ có hệ số thiết kế thấp hơn hơn hệ số của nghiên cứu về tỉ lệ bị cúm H1N1

trong cộng đồng. Hệ số thiết kế có thể tính được từ việc nghiên cứu thử. Nếu không có điều

kiện thực hiện nghiên cứu thử, tính hệ số thiết kế có thể chọn hệ số thiết kế là 3 hay 4.

Hàm n.for.survey của ngôn ngữ R có đối số deff (design effect for cluster sampling) để hiệu

chỉnh cho lấy mẫu cụm. Quay trở lại thí dụ về nghiên cứu ước lượng tỉ lệ tiêm chủng với tỉ lệ

4

ước đoán là tỉ lệ giả thuyết=80%, sai số biên d=5% với mức tin cậy 95%, giả sử chúng ta sử

dụng phương pháp lấy mẫu cụm với hệ số thiết kế deff=2, cỡ mẫu cần thiết là

Lệnh zpsampsi trong Stata cũng có thể được sử dụng để hiệu chỉnh cho hệ số thiết kế:

.. zzppssaammppssii,, pprrooppoorrttiioonn((00..88)) eerrrroorr((00..0055)) ddeessiiggnn((22))

EEssttiimmaatteedd ssaammppllee ssiizzee ffoorr eessttiimmaattiinngg pprrooppoorrttiioonn ffrroomm aa ddeessccrriippttiivvee ssttuuddyy


pp == ..88

MMaarrggiinnaall eerrrroorr == ..0055

DDeessiiggnn eeffffeecctt == 22




nn == 449922

4. Hiệu chỉnh để tính cỡ mẫu khi dân số đích là hữu hạn

Công thức tính cỡ mẫu trên là dành lấy mẫu từ một dân số đích vô hạn hay khá lớn. Nếu cỡ

mẫu chiếm tỉ lệ trên 10% dân số đích, ta có thể điều chỉnh để có cỡ mẫu nhỏ hơn.

PN

PNNhc

Với N là cỡ mẫu chưa hiệu chỉnh, P là kích thước của dân số đích và Nhc là cỡ mẫu sau khi đã

hiệu chỉnh. Nếu chúng ta muốn tính cỡ mẫu để ước lượng tỉ lệ sử dụng bao cao su khi quan

hệ tình dục với khách hàng ở phụ nữ mãi dâm quận 11 được tiếp cận với chương trình giáo

dục đồng đẳng. Với tỉ lệ đoán sử dụng bao cao su là 50%, sai số biên là 5% với mức tin cậy

95%, và số phụ nữ mãi dâm ở quận 11 tiếp cận được với chương trình giáo dục đồng đẳng là

634 người, cỡ mẫu chưa hiệu chỉnh được tính là:

38405.005.0

5.05.084.3

)1(2

2

2/1

d

ppZN

Cỡ mẫu hiệu chỉnh cho dân số đích =634 là

239634384

634384

PN

PNNhc

5. Hiệu chỉnh để tính cỡ mẫu nhằm ước lượng

Chúng ta cũng nên phải trù liệu cho những số liệu bị mất, những trường hợp từ chối nghiên

cứu bằng cách tăng cỡ mẫu.

6. Một thí dụ về tính cỡ mẫu nghiên cứu thử nghiệm lâm sàng nhằm mô tả tỉ lệ

Dưới đây là một đoạn về tính cỡ mẫu trong một nghiên cứu loạt ca với mục tiêu chính là xác

định hiệu quả của điều trị:

Cỡ mẫu cần thiết

Đây là một nghiên cứu không can thiệp và quan sát nên cỡ mẫu 500 bệnh nhân là dựa trên

tính khả thi.

Giả định với cỡ mẫu 500, nó có thể cho phép ước lượng tỉ lệ của Triệu chứng X ở bệnh nhân

B (dựa trên khoảng tin cậy hai bên 95%) với độ chính xác tối đa 0,045 với tỉ lệ ước tính là

0,50.

Phân tích thống kê sẽ chỉ là mô tả và thăm dò.

Phân tích sẽ được tiến hành dựa trên quần thể ý định điều trị bao gồm tất cả các bệnh nhân

đã nhận được điều trị và có bất cứ thông tin có được trong theo dõi.

5

Ước lượng trung bình với một độ chính xác nhất định

Công thức để ước lượng trung bình của một biến số định lượng có độ lệch chuẩn là σ với sai

số d ở mức tin cậy (1-) là:

2

22

2/1d

Zn

Trong Stata, lệnh zmsampsi có thể sử dụng để tính cỡ mẫu nhằm ước lượng một trung bình

(package do Đỗ Văn Dũng viết). Cú pháp của lệnh zpsampi là:

zzmmssaammppssii,, ssdd((11)) eerrrroorr((00..11)) lleevveell((9955)) ddeessiiggnn((11))

Thí dụ: để ước lượng trung bình của trẻ sơ sinh đủ tháng sinh tại bệnh viện Hùng Vương

thành phố Hồ Chí Minh với sai số biên là 20 gram ở mức tin cậy 95% biết rằng độ lệch của

trọng lượng trẻ sơ sinh đủ tháng là 480 gram cần cỡ mẫu

.. zzmmssaammppssii,, ssdd((448800)) eerrrroorr((2200))

EEssttiimmaatteedd ssaammppllee ssiizzee ffoorr eessttiimmaattiinngg mmeeaann ffrroomm aa ddeessccrriippttiivvee ssttuuddyy


SSDD == 448800

MMaarrggiinnaall EErrrroorr == 2200




nn == 22221133

1. Chọn lựa sai số biên d

Không có quy tắc cứng nhắc độ chính xác d, điều này phụ thuộc vào mục tiêu của nghiên cứu

và vào tài nguyên hiện có. Thông thường sai số biên d phải đủ nhỏ để kết quả của nghiên cứu

có giá trị. Thí dụ nếu tại BV Hùng Vương trong năm vừa rồi đã có một nghiên cứu ước lượng

trung bình của trọng lượng trẻ sơ sinh đủ tháng với sai số biên 20 gram ở mức tin cậy 95% và

nếu không có cơ sở để cho rằng trọng lượng trung bình của trẻ sơ sinh đủ tháng thay đổi trên

50 gram thì nghiên cứu ước lượng trung bình của trọng lượng trẻ sơ sinh đủ tháng với sai số

biên 50 gram ở mức tin cậy 95% là ít có giá trị khoa học.

Đôi khi người ta không cho sai số d nhưng lại cung cấp giá trị trung bình giả thuyết

(hypothesized mean) và trung bình đòi hỏi (postulated mean). Khi đó sai số chính là trị tuyệt

đối của hiệu số trung bình giả thuyết và trung bình đòi hỏi.

Cỡ mẫu để kiểm định một giả thuyết

Trong nhiều nghiên cứu mục tiêu nghiên cứu là kiểm định giả thuyết. Thí dụ một nghiên cứu

có giả thuyết là nhóm sản phụ được dùng 600µg misoprostol ngay sau khi sinh để dự phòng

băng huyết sau sinh giảm nguy cơ băng huyết sau sinh so với nhóm sản phụ ở nhóm chứng.

Câu trả lời cho nghiên cứu này là có hay không. Và với câu trả lời nào thì cũng có khả năng

bị sai lầm. Nếu câu trả lời là có giảm nguy cơ trong khi thực sự là không giảm thì sai lầm này

được gọi là sai lầm loại 1 (type 1 error), nếu câu trả lời là không giảm nguy cơ trong khi thực

sự là có giảm thì sai lầm này được gọi là sai lầm loại 2. Chúng ta phải chọn cỡ mẫu sao cho

các xác suất sai lầm này là chấp nhận được và nghiên cứu là khả thi.

Xác suất sai lầm loại 1 còn được gọi là xác suất sai lầm alpha là xác suất nghiên cứu kết luận

là có sự khác biệt trong khi thực sự không có sự khác biệt (xác suất bác bỏ giả thuyết giả

thuyết Ho trong khi giả thuyết Ho đúng). Xác suất sai lầm loại 2 còn được gọi là xác suất sai

lầm beta là xác suất nghiên cứu kết luận là không có sự khác biệt trong khi thực sự có sự khác

biệt (xác suất chấp nhận giả thuyết giả thuyết Ho trong khi giả thuyết Ha đúng).

6

Bảng 1. Phân loại sai lầm theo kết luận của nghiên cứu so với chân lí khoa học

Chân lí là Ha đúng

(Thực sự có khác biệt)

Chân lí là Ho đúng

(Thực sự không khác

biệt)

Bác bỏ giả thuyết H0

(Kết luận có sự khác biệt)

Kết luận đúng

(Xác suất = 1- =

Power của nghiên cứu)

Sai lầm loại 1

(Xác suất = )

Không bác bỏ giả thuyết H0

(Kết luận không có sự khác biệt)

Sai lầm loại II

(Xác suất = )

Kết luận đúng

(Xác suất = 1-)

Để các cán bộ y tế dễ dàng liên hệ, có thể hình dung kết luận của một nghiên cứu tương tự

như kết luận của một xét nghiệm trong chẩn đoán bệnh nhân có mắc bệnh (Ha đúng) hay

không mắc bệnh (Ho đúng). Khi đó 1-β, còn được gọi là power của nghiên cứu, có ý nghĩa

tương tự như độ nhạy của test chẩn đoán, còn 1-α của nghiên cứu có ý nghĩa tương tự như

độ chuyên của test chẩn đoán. Hệ quả của phép tương tự này là:

- Nếu trong lâm sàng chúng ta sẽ không sử dụng test chẩn đoán nếu test này có độ nhạy và độ

chuyên kém thì chúng ta cũng sẽ không tiến hành nghiên cứu nếu nghiên cứu này có power

kém và xác suất sai lầm loại 1 cao.

- Nếu test chẩn đoán ra kết quả âm và chúng ta nhìn lại thấy độ nhạy của test chẩn đoán kém

thì chúng ta không thể bác bỏ được chẩn đoán. Tương tự như vậy, nếu kết luận của nghiên

cứu là không có sự khác biệt nhưng nếu chúng ta thấy power của nghiên cứu kém thì chúng

ta không thể cho rằng là 2 điều trị này là tương đương.

Vì vậy để tính cỡ mẫu cho nghiên cứu có mục tiêu kiểm định giả thuyết, trước tiên cần phải

xác định xác suất sai lầm loại 1 và power của nghiên cứu. Thông thường, xác suất sai lầm

loại 1 (alpha) được chọn ở mức ý nghĩa 5% và power thay đổi theo nguồn lực của nghiên

cứu nhưng thường power nên chọn từ 0,8 trở lên.

Kiểm định một giả thuyết, so sánh tỉ lệ của 2 nhóm

Giả sử chúng ta muốn so sánh hai tỉ lệ (thí dụ tỉ lệ trẻ em được bú sữa non trong hai nhóm bà

mẹ: một nhóm được giáo dục sức khỏe và một nhóm không). Chúng ta có thể kiểm định xem

hai tỉ lệnày có khác nhau đáng kể hay không, nói cách khác kiểm định xem hiệu số của hai tỉ

lệ này có khác một cách có ý nghĩa với zero hay không.

Ðể tính cỡ mẫu nhằm so sánh 2 tỉ lệ (trong trường hợp cỡ mẫu của 2 nhóm so sánh bằng

nhau), chúng ta ngoài mức alpha và power của nghiên cứu đã được quyết định, cần xác định

2 thông số sau dựa trên y văn hoặc theo phán đoán của nhà nghiên cứu

- Tỉ lệ 1 trong nhóm nền (thí dụ tỉ lệ có biến cố ở nhóm được sử dụng placebo)

- Tỉ lệ 2 trong nhóm quan tâm (thí dụ tỉ lệ có biến cố ở nhóm can thiệp)

Có hai công thức tính cỡ mẫu (cho mỗi nhóm) để so sánh hai tỉ lệ 1 và 2 của hai nhóm.

Một công thức có hiệu chỉnh cho tính liên tục của xấp xỉ bình thường của phân phối nhị thức

và công thức không hiệu chỉnh. Phần lớn phần mềm thống kê khi tính cỡ mẫu để so sánh 2 tỉ

lệ sử dụng công thức có hiệu chỉnh cho tính liên tục

Công thức tính cỡ mẫu ở nhóm đối chứng để so sánh 2 tỉ lệ không hiệu chỉnh cho tính liên tục

2

21

221112/1

1)(

)1()1()1()1(

R

RzRzn

Công thức tính cỡ mẫu ở nhóm đối chứng để so sánh 2 tỉ lệ có hiệu chỉnh cho tính liên tục

7

21

2

21

221112/1

1

1

)(

)1()1()1()1(

R

R

R

RzRzn

Trong đó:

α: mức ý nghĩa (hay xác suất sai lầm loại 1) của kiểm định

1-β: power của nghiên cứu thường được chọn là 80% hay 90%

1 Tỉ lệ có biến cố trong nhóm đối chứng

2 Tỉ lệ có biến cố trong nhóm quan tâm

: Tỉ lệ đáp ứng chung của 2 nhóm, R

R

1

21

với R là tỉ số của nhóm quan tâm trên nhóm đối chứng

Trong trường hợp cỡ mẫu nhóm nền bằng cỡ mẫu nhóm chứng thì R là 1 thì các công thức

tính cỡ mẫu ở trên sẽ trở thành:

Công thức tính cỡ mẫu so sánh 2 tỉ lệ có hiệu chỉnh cho tính liên tục

21

2

21

2

2/122111 2

)(

})1(2)1()1({

zzn

Công thức tính cỡ mẫu so sánh 2 tỉ lệ không hiệu chỉnh cho tính liên tục

2

21

2

2/122111

)(

})1(2)1()1({

zzn

Trong hai công thức này:

α: mức ý nghĩa (hay xác suất sai lầm loại 1 chấp nhận được

1-β: power của nghiên cứu.

1 Tỉ lệ có biến cố trong nhóm nền

2 Tỉ lệ có biến cố trong nhóm quan tâm

Để tính cỡ mẫu trong ngôn ngữ R sử dụng hàm n.for.2p (p1, p2, alpha = 0.05, power = 0.8,

ratio = 1); để tính cỡ mẫu trong phần mềm Stata, sử dụng lệnh sampsi #1 #2 , power(0.90)

alpha(0.05) ratio(1)

Thí dụ: Một nghiên cứu có giả thuyết là nhóm sản phụ được dùng 600µg misoprostol ngay

sau khi sinh để dự phòng băng huyết sau sinh giảm nguy cơ băng huyết sau sinh so với nhóm

sản phụ ở nhóm chứng. Giả định rằng tỉ lệ băng huyết sau sinh ở nhóm chứng là 10% và sử

dụng misoprostol làm giảm 50% nguy cơ bị băng huyết sau sinh tương ứng với tỉ lệ băng

huyết sau sinh ở nhóm can thiệp là 5%. Để có cỡ mẫu với power=96% và xác suất sai lầm

loại 1 alpha là 5%, cỡ mẫu cần thiết là được tính theo hàm n.for.2p của ngôn ngữ R là:

Để có cỡ mẫu với power=96% và xác suất sai lầm loại 1 alpha là 5%, cỡ mẫu cần thiết là

được tính theo lệnh sampsi của phần mềm R được tính như sau:

.. ssaammppssii 00..11 00..0055,, ppoowweerr((00..9966))

8

Kiểm định một giả thuyết cho kết cuộc định tính: các dạng đặc biệt

1- Cỡ mẫu cho nghiên cứu đoàn hệ

Để tính cỡ mẫu cho nghiên cứu đoàn hệ, ngoài α là xác suất sai lầm loại 1 và 1-β là power của

nghiên cứu còn cần 2 thông số sau:

- Tỉ lệ có biến cố ở nhóm không phơi nhiễm 1

- Tỉ số nguy cơ RR, từ đó ta tính được tỉ lệ có biến cố ở nhóm phơi nhiễm 2

Sau đó chúng ta có thể tính được cỡ mẫu cần thiết dựa trên công thức tính cỡ mẫu để so sánh

2 tỉ lệ:

Thí dụ: Một nghiên cứu đoàn hệ kéo dài trong 5 năm nhằm xác định mối liên quan giữa hút

thuốc lá và bệnh mạch vành tim ở đàn ông trên 50 tuổi. Giả sử ở người đàn ông trên 50 tuổi

không hút thuốc lá nguy cơ bị bệnh mạch vành tim trong 5 năm là 10% (1) và hút thuốc là

làm tăng nguy cơ bệnh mạch vành tim lên 2 lần (RR=2). Cỡ mẫu cần thiết cho nghiên cứu có

alpha=0,05 và power=90% được tính với hàm n.for.2p của ngôn ngữ R như sau:

Trong phần mềm Stata cũng có thể tính cỡ mẫu cho nghiên cứu đoàn hệ sử dụng lệnh

zesampsi

.. zzeessaammppssii 00..11,, rrrr((22))


aallpphhaa == ..0055

ppoowweerr == ..99

RRiisskk aammoonngg nnoonn--eexxppoossee == ..11

EEssttiimmaatteedd rreeqquuiirreedd ssaammpplleess ssiizzee ffoorr ccoohhoorrtt ssttuuddyy wwiitthh RRRR== 22

NNuummbbeerr ooff eexxppoosseedd == 228866

NNuummbbeerr ooff uunneexxppoosseedd == 228866

9

Công thức tính cỡ mẫu ước ượng RR cho nghiên cứu đoàn hệ

Kí hiệu ε = ln(RRmin/RR)=1-RRmin/RR

LnRR=lnRR ± ε = lnRR ± 01

2/1

1111

NcNaZ =

lnRR ± 000111

2/1

1111

NpNNpNZ

= lnRR ± 11

11

01

2/1

ppN

Z

211

211

01

2/1

01

2/1

pp

ZN

ppN

Z

==>

2012

2

012

01

2

2

)1ln(

211

211

211

2/12/1

2/1

d

ppZ

ppZN

pp

ZN

ε = ln(RRmin/RR)

ε = ln[1- (RRmin-RR)/RR] = ln[1- εd]

với εd = (RRmin-RR)/RR là sai số tương đối

2- Cỡ mẫu cho nghiên cứu bệnh chứng

Để tính cỡ mẫu cho nghiên cứu đoàn hệ, ngoài α là xác suất sai lầm loại 1 và 1-β là power của

nghiên cứu còn cần 2 thông số sau:

- Tỉ lệ phơi nhiễm với yếu tố nguy cơ ở nhóm chứng 1 (1 cũng xấp xỉ bằng tỉ lệ phơi nhiễm

trong cộng đồng). Hiện nay có lưu hành một số tài liệu về tính cỡ mẫu trong đó đưa thí dụ về

tính cỡ mẫu cho nghiên cứu bệnh chứng nhưng dựa thông số tỉ lệ mắc bệnh trong cộng đồng

(chứ không phải là tỉ lệ phơi nhiễm trong cộng đồng) và điều này là không đúng với nguyên

tắc của nghiên cứu bệnh chứng.

- Tỉ số số chênh OR, từ đó ta tính được tỉ lệ phơi nhiễm với yếu tố nguy cơ ở nhóm bệnh 2.

)1()1(1 11

1

1

12

OR

OR

OR

OR

Sau đó chúng ta có thể tính được cỡ mẫu cần thiết dựa trên công thức tính cỡ mẫu để so sánh

2 tỉ lệ (đây là cách tiếp cận được sử dụng trong nhiều tài liệu về thống kê và trong các phần

mềm thống kê như StatDirect, EpiInfo,…)

Thí dụ: Một nghiên cứu bệnh chứng nhằm xác định mối liên quan giữa hút thuốc lá và bệnh

mạch vành tim ở đàn ông trên 50 tuổi. Mối liên hệ được xem là có ý nghĩa về y tế công cộng

10

khi OR>1,5. Giả sử tỉ lệ hút thuốc lá ở đàn ông trên 50 tuổi là 40%, ta có thể giả định tỉ lệ

hút thuốc lá cơ ở nhóm chứng 1 cũng là 40%. Khi đó tỉ lệ hút thuốc lá ở nhóm bệnh là 0,5 và

cỡ mẫu cần thiết là 538 người ở mỗi nhóm chứng và bệnh. Các lệnh để thực tính cỡ mẫu trên

ngôn ngữ R như sau: > 0.4*1.5/(1+0.4*0.5)

[1] 0.5

Vì công thức tính tỉ lệ phơi nhiễm ở nhóm bệnh cũng khó nhớ, do đó có một số tác giả (Đỗ

Văn Dũng) đã viết một số package để tính cỡ mẫu cho nghiên cứu bệnh chứng. Lệnh để tính

cỡ mẫu cho nghiên cứu bệnh chứng trong phần mềm Stata là zesampsi.

.. zzeessaammppssii 00..44,, oorr((11..55)) ppoowweerr((00..99)) aallpphhaa((00..0055)) rraattiioo((11))


aallpphhaa == ..0055

ppoowweerr == ..99

PPrrooppoorrttiioonn ooff eexxppoosseedd aammoonngg ccoonnttrroollss == ..44

EEssttiimmaatteedd rreeqquuiirreedd ssaammppllee ssiizzeess ffoorr ccaassee--ccoonnttrrooll ssttuuddyy wwiitthh OORR== 11..55

NNuummbbeerr ooff ccaasseess == 553388

NNuummbbeerr ooff ccoonnttrroollss == 553388

Lưu ý: Mặc dù hiện nay có một số bài báo cáo sử dụng công thức khác để tính cỡ mẫu nhằm

xác định OR nhưng không trích dẫn tài liệu tham khảo và không đưa ra cơ sở lí luận để tính

cỡ mẫu. Ngoài ra khi sử dụng các công thức trên để tính toán cỡ mẫu thì kết quả là khác với

kết quả do các phần mềm thống kê thường dùng như Epi-Info, R đưa ra. Vì vậy cần thận

trọng khi sử dụng những công thức như vậy.

Bởi vì để kiểm định cho một phân phối có trung bình là μ và sai số chuẩn σ/√n

cần μ/(σ/√N) > Z1-α/2

Để đảm bảo với xác suất (1-β) hệ số μ/(σ/√N) > Z1-α/2 ta cần μ/(σ/√N) > (Z1-α/2+Z1-β)

nên cỡ mẫu tối thiểu

√N= (Z1-α/2 + Z1-β)*σ/μ

N= (Z1-α/2 + Z1-β)2*σ

2/μ

2

Do sai số chuẩn của lnOR là dcba

1111 =

0011 1

11

1

111

ppppN

=)1(

21

)1(

12

1

1

112

1

ppNppNppN

Nên công thức tính cỡ mẫu cho nghiên cứu bệnh chứng là (cho 1 nhóm)

)1()(ln

2 Z Z

)1(ln

2 Z Z

2

2

-1/2-1

2

2

-1/2-1ppORppOR

N

11

2

21

2

2/122111

)(

})1(2)1()1({

zzn

Thí dụ: Tỉ lệ hiện mắc của gẫy lún đốt sống trong quần thể là 25%. Muốn xác định ảnh hưởng

của hút thuốc lá lên gẫy lún đốt sống với tỉ số số chênh dự kiến là 2, với mức ý nghĩa là 5%

(kiểm định hai bên) và lực mẫu là 80%.

Với những thông tin trên không xác định được cỡ mẫu vì thông tin cho biết tỉ lệ hiện mắc của

gẫy lún đốt sống trong quần thể là tham số không có vai trò trong xác định cỡ mẫu. Muốn xác

định cỡ mẫu cần xác định tỉ lệ hút thuốc lá ở quần thể chung. Giả sử tỉ lệ hút thuốc lá trong

dân số chung là 40% thì ta sử dụng lệnh:

n.for.epi(0.4, OR=2 ,power=0.8,sided=2)

Cỡ mẫu cần thiết là 144 người cho mỗi nhóm

Nếu sử dụng công thức 9

(1+1)^2*(qnorm(0.975)+qnorm(0.8))^2/(log(2))^2/(1-0.5714286)/0.5714286

cỡ mẫu là 267 cho mỗi người

12

Công thức tính cỡ mẫu ước ượng OR cho nghiên cứu bệnh chứng

Kí hiệu ε = ln(ORmin/OR)=1-ORmin/OR

LnOR=lnOR ± ε = lnOR ± dcba

Z1111

2/1 =

lnOR ± )1(

11

)1(

11

00001111

2/1pNpNpNpN

Z

= lnOR ± )1(

11

)1(

11

0011

2/1

ppppN

Z

)1(

11

)1(

11

)1(

11

)1(

11

0011

2/1

0011

2/1

pppp

ZN

ppppN

Z

==>

200112

2

00112

0011

2

2

)1ln(

)1(

11

)1(

11

)1(

11

)1(

11

)1(

11

)1(

11

2/12/1

2/1

ppppZ

ppppZN

pppp

ZN

ε = ln(ORmin/OR) = ln(0.9) = -0.1053605

ε = ln[1- (ORmin-OR)/OR] = ln[1- εd]

với εd = (ORmin-OR)/OR

13

3a- Cỡ mẫu cho nghiên cứu theo dõi dọc sử dụng HR

Để tính cỡ mẫu do Schoenfeld đề xuất cho nghiên cứu theo dõi dọc sử dụng HR, ngoài α là

xác suất sai lầm loại 1 và 1-β là power của nghiên cứu còn cần 2 thông số sau:

- Tỉ lệ có biến cố ở nhóm không phơi nhiễm 1

- Tỉ số nguy hại HR (hazard ratio), từ đó ta tính được tỉ lệ có biến cố ở nhóm phơi nhiễm 2

Thí dụ 1: Một nghiên cứu đoàn hệ kéo dài trong 5 năm nhằm xác định mối liên quan giữa hút

thuốc lá và bệnh mạch vành tim ở đàn ông trên 50 tuổi. Giả sử ở người đàn ông trên 50 tuổi

không hút thuốc lá nguy cơ bị bệnh mạch vành tim trong 5 năm là 10% (1) và hút thuốc là

làm tăng nguy cơ bệnh mạch vành tim lên 2 lần (HR=2). Khi đó có 2 cách để tính cỡ mẫu:

3.1. Từ tỉ lệ có biến cố ở nhóm không phơi nhiễm 1 và HR tính tỉ lệ có biến cố ở nhóm phơi

nhiễm 2 = 1-exp(log(1-1) × HR) =0.19. Sử dụng công thức so sánh 2 tỉ lệ để tính cỡ mẫu

(Xem lại thí dụ ở phần cỡ mẫu cho nghiên cứu đoàn hệ). Cỡ mẫu cần thiết được ước đoán là

684 người.

3.2. Giả định tỉ số nhóm phơi nhiễm và nhóm không phơi nhiễm là 1:1. Khi đó tỉ lệ có biến số

chung ở 2 nhóm là = 1 × (1+HR)/2 = 14.5%. Sử dụng công thức sau để tính số biến cố cần

thiết ở nhóm can thiệp trong nghiên cứu sống còn

2

2

12/1)ln(

1)1()(

HRr

rZZE

21

2

2

12/1

1

)ln(

1)1()(

HRr

rZZN

Trong đó:



r: Tỉ số nhóm chứng : nhóm can thiệp.

HR: Tỉ số nguy hại cần ước lượng

1 Tỉ lệ có biến cố trong nhóm được 15%

2 Tỉ lệ có biến cố trong nhóm phơi nhiễm được ước tính là 3%

HR: tỉ số nguy hại; HR=)1ln(

)1ln(

2

1

=0,187

Cỡ mẫu của nhóm chứng là N × m

Sử dụng hàm e.for.survival ta có thể tính được số biến cố chung cần thiết cho nghiên cứu

Sử dụng lệnh stpower cox của phần mềm Stata với cú pháp như sau,

.. ssttppoowweerr ccooxx,, ppoowweerr((00..99)) hhrraattiioo((22)) ffaaiillpprroobb((00..114455)) hhrr

EEssttiimmaatteedd ssaammppllee ssiizzee ffoorr CCooxx PPHH rreeggrreessssiioonn

WWaalldd tteesstt,, hhaazzaarrdd mmeettrriicc

HHoo:: [[bb11,, bb22,, ......,, bbpp]] == [[00,, bb22,, ......,, bbpp]]

IInnppuutt ppaarraammeetteerrss::

aallpphhaa == 00..00550000 ((ttwwoo ssiiddeedd))

hhrraattiioo == 22..00000000

ssdd == 00..55000000

ppoowweerr == 00..99000000

14

PPrr((eevveenntt)) == 00..11445500

EEssttiimmaatteedd nnuummbbeerr ooff eevveennttss aanndd ssaammppllee ssiizzee::

EE == 8888

NN == 660044

Như vậy khi thực hiện nghiên cứu cần quan sát được 88 biến cố xảy ra. Và để có 88 biến cố

xảy ra trong vòng 5 năm cần có 302 người trong mỗi nhóm. Tổng số người đưa vào nghiên

cứu là 604 người.

Thí dụ 2: Một nhà nghiên cứu muốn so sánh hiệu quả của một loại điều trị so với placebo

với kết cuộc chính là thời điểm xuất hiện nhiễm trùng với mức ý nghĩa 2 bên 0,05 và power

là 90%. Ông ta muốn theo dõi bệnh nhân trong vòng 1 năm và ông ta mong đợi ở nhóm

placebo có 40% bệnh nhân bị nhiễm trùng và ở nhóm điều trị có 20% bệnh nhân bị nhiễm

trùng. Cỡ mẫu cần thiết được tính theo công thức:

Như vậy cần theo dõi tổng số 62 biến cố. Số người cần theo dõi ở cả 2 nhóm là:

62/(0.2/2+0.4/2) = 206.

Như vậy nghiên cứu cần đưa vào 103 bệnh nhân vào nhóm placebo và 103 bệnh nhân vào

nhóm can thiệp.

3b- Cỡ mẫu cho nghiên cứu theo dõi dọc phép kiểm log rank

Đây là nghiên cứu đoàn hệ với kết cuộc là biến số thời gian xảy ra biến cố nên nghiên cứu sử

dụng công thức của Friedman [1] xác định tổng số biến cố:

2

21

2

12/11

11}{

HR

HRzzn

Nếu tỉ số cỡ mẫu giữa 2 nhóm ratio khác với một thì có thể tính số biến cố cho từng nhóm

như sau:

ratioratioHR

ratioHRzze

)1(

1

1

1*}{2

2

2

12/1

2

21

2

12/11

1*1}{

HR

ratioHRzzn

Trong đó

α: mức ý nghĩa (hay xác suất sai lầm loại 1) chấp nhận được chọn là 0,05

1-β: power của nghiên cứu được chọn là 80%




)1ln(

2

1

=0,187

Từ công thức tính cỡ mẫu trên ta có được số biến cố cần thiết là 12 trường hợp và tổng số

bệnh nhân cần cho nghiên cứu là 125 bệnh nhân.

Đây là nghiên cứu đoàn hệ với kết cuộc là biến số thời gian xảy ra biến cố nên nghiên cứu sử

dụng công thức của Friedman:

15

2

2

12/1)ln(

1)1()(

HRr

rZZE

21

2

2

12/1

1

)ln(

1)1()(

HRr

rZZN

Trong đó:



r: Tỉ số nhóm chứng : nhóm can thiệp.

HR: Tỉ số nguy hại cần ước lượng




)1ln(

2

1

=0,187

Từ công thức tính cỡ mẫu trên ta có được số biến cố cần thiết là 12 trường hợp và tổng số

bệnh nhân cần cho nghiên cứu là 125 bệnh nhân.

4- Cỡ mẫu để so sánh các tỉ lệ nhỏ

Các công thức tính cỡ mẫu ở trên khi n×p ≥ 5 và n×(1-p) ≥ 5. Khi các điều kiện trên không

thỏa thì phân phối nhị thức không xấp xỉ tốt với phân phối bình thường. Khi đó để tính cỡ

mẫu, sử dụng công thức tính cỡ mẫu với phép biến đổi góc (angular transformation). Một ưu

điểm khác của phép biến đổi góc arcsine có ưu điểm là có phương sai không phụ thuộc vào

ước lượng của tham số p. Công thức để tính cỡ mẫu so sánh các tỉ lệ nhỏ là:

2

1

2

2/1

)2arcsin(arcsin2

)(

ZZN

Thí dụ: một nghiên cứu so sánh 2 tử vong sau 30 ngày trong 2 phương pháp cách điều trị tắc

mật do bệnh lí ác tính bằng cách sử dụng cầu nối (bypass) hoặc đặt stent. Tỉ lệ tử vong trong

30 ngày của phương pháp sử dụng cầu nối là 20% và của phương pháp đặt stent được ước

đoán là 5%. Cỡ mẫu cần thiết là 115 người cho mỗi nhóm.

5- Cỡ mẫu để ước lượng tần suất biến cố ngoại ý hiếm

Trong các loại thử nghiệm lâm sàng có một loại thử nghiệm lâm sàng được gọi là thử nghiệm

tính an toàn mở rộng (Expanded Safety trials). Thử nghiệm tính an toàn mở rộng là thử

nghiệm lâm sàng giai đoạn 4 được thiết kế nhằm để ước lượng tần suất của các biến cố hiếm

mà chưa được phát hiện ở các nghiên cứu trước đó. Những nghiên cứu này thường là nghiên

cứu không ngẫu nhiên.

Trong loại nghiên cứu này người ta thường giả định quần thể nghiên cứu lớn, xác suất của

biến cố ngoại ý là nhỏ và mọi đối tượng được theo dõi ở thời gian xấp xỉ bằng nhau. Bởi vì

các giả định này chúng ta có thể mô hình hóa xác suất có x biến cố xảy ra dựa theo hàm xác

suất Poisson.

!)(

x

exXf

x

Để phát hiện được biến cố xảy ra nghiên cứu phải có cỡ mẫu đủ lớn để xác suất β cao phát

hiện ít nhất một biến cố ngoại ý (với xác suất xảy ra biến cố ở 1 bệnh nhân là p)

16

β=P(X≥1)=1-P(X=0)= pN

x

eex

e

11!

1

Điều này có nghĩa là cỡ mẫu phải lớn hơn:

pN

pN

)1ln(

)1ln(

Thí dụ: một công ty dược phẩm dự định tiến hành một thử nghiệm an toàn mở rộng (ES trial)

cho một thuốc chống loạn nhịp mới. Công ty muốn xác định một đoàn hệ để theo dõi trong 2

năm biến chứng nhồi máu cơ tim ở bệnh nhân. Công ty muốn có xác suất 99% phát hiện được

nguy cơ có biến chứng nhồi máu cơ tim 1/1000. Cỡ mẫu cần thiết là 4606.

Kiểm định một giả thuyết, so sánh trung bình của 2 nhóm

Bởi vì để kiểm định cho một phân phối có trung bình là μ và sai số chuẩn σ/√n

cần μ/(σ/√N) > Z1-α/2

Để đảm bảo với xác suất (1-β) hệ số μ/(σ/√N) > Z1-α/2 ta cần μ/(σ/√N) > (Z1-α/2+Z1-β)

nên cỡ mẫu tối thiểu

√N= (Z1-α/2 + Z1-β)*σ/μ

N= (Z1-α/2 + Z1-β)2*σ

2/μ

2

Vì vậy công thức để tính cỡ mẫu nhằm so sánh trung bình của 2 nhóm (nhóm 1 có trung bình

giả thuyết là μ1 và độ lệch chuẩn là σ1 ; nhóm 2 có trung bình giả thuyết là μ2 và độ lệch

chuẩn là σ2)

2

21

2

2

2

1

2

2/11

)(

)()(

zzn

Để tính cỡ mẫu cho nghiên cứu kiểm định giả thuyết so sánh 2 trung bình, có thể sử dụng

hàm n.for.2means trong ngôn ngữ R để hoặc lệnh sampsi trong phần mềm Stata.

n.for.2means (mu1, mu2, sd1, sd2, ratio = 1, alpha = 0.05, power = 0.8)

Đôi khi người ta không cung cấp các hiệu số sự khác biệt mà cung cấp hiệu số sự khác biệt

chia cho độ lệch chuẩn. Con số này được gọi là cỡ của tác động (effect size) d. Khi đó công

thức tính cỡ mẫu là:

2

2

2/11 2)(

d

zzn

Kiểm định một giả thuyết, so sánh trung bình của 1 nhóm trước và sau can thiệp

Công thức để tính cỡ mẫu nhằm so sánh trung bình của 1 nhóm trước và sau can thiệp (với

hiệu quả can thiệp d=µ1- µ2) và độ lệch chuẩn của hiệu quả can thiệp là σ như sau:

2

22

2/11

2

21

22

2/11 )(

)(

)(

d

zzzzn

Để tính cỡ mẫu cho nghiên cứu kiểm định giả thuyết so sánh 2 trung bình, có thể sử dụng

lệnh sampsi trong phần mềm Stata.

Thí dụ:

Một nghiên cứu thử đánh giá hiệu quả của một loại thuốc hạ áp trên bệnh nhân cao huyết áp.

17

Nhà nghiên cứu ước đoán huyết áp trước điều trị trung bình là 150 mmHg sẽ giảm còn 140

mmHg và độ lệch chuẩn của mức độ giảm huyết áp là 30mmHg. Cỡ mẫu cần thiết với lực

mẫu là 80% và mức ý nghĩa là 5% (hai bên)

Kiểm định ý nghĩa của hệ số tương quan một mẫu

Hệ số tương quan r không có phân phối bình thường, vì vậy muốn xác định cỡ mẫu cho hệ số

tương quan người ta phải sử dụng phép biến đổi z kinh điển của Fisher:

r

rz

1

1log5.0

z có phân phối bình thường với độ lệch chuẩn là N-3

Vì vậy để kiểm định hệ số tương quan r1 có khác biệt có ý nghĩa với hệ số tương quan r2

(tham số từ quần thể), chúng ta sử dụng công thức tính cỡ mẫu:

3

)()(

)(2

01

2

2/11

rzrz

zzn

với

1

11

1

1log5.0)(

r

rrz

và

2

22

1

1log5.0)(

r

rrz

Thí dụ

Thí dụ 1: Trong sinh lí học hô hấp, giả định rằng sự tương quan giữa thể tích thở ra gắng sức

trong một giây đầu tiên (FEV1) và dung tích sống gắng sức (FVC) ở người khỏe mạnh là 0,6.

Giả sử có một nhóm bệnh nhân bệnh hô hấp khám tại phòng khám Bệnh viện Đại học Y dược

và nhà nghiên cứu muốn kiểm dịnh có sự tương quan giữa FEV1 và FVC ở những bệnh nhân

này hay không. Do chúng ta không mong đơi có sự tương quan dương, vì vậy kiểm định là ở

một bên với mức ý nghĩa là 5% và power 80%. Cỡ mẫu cần thiết được tính như nhau: (David

Machin, 1997)

Chúng ta cần tối thiểu 16 người, mỗi người được đo lường cả FEV1 và FVC để kiểm định

giả thuyết có sự tương quan giữa FEV1 và FVC ở mức ý nghĩa một bên của alpha= 0.05 và

power=0.6

Thí dụ 2: Nếu bệnh nhân bị tăng huyết áp nhẹ được sử dụng một loại thuốc, huyết áp giảm

xuống có liên qian đến giảm độ nhớt của máu với hệ số tương quan là 0,3. Giả sử chúng ta

tiến hành thử nghiệm tương tự với bệnh nhân tăng huyết áp nặng và quan sát được sự giảm

huyết áp và giảm độ nhớt sau khi uống thuốc. Số bệnh nhân cần được khảo sát để có hệ số

tương quan có ý nghĩa thống kê, nếu độ lớn của hệ số tương quan được ước đoán là 0,3.

(David Machin, 1997)

Trong trường hợp này chúng ta không rõ tương quan sẽ đi theo hướng nào va có thể có tương

quan dương hay âm, vì vậy chúng ta quyết định sử dụng kiểm định 2 đuôi với mức ý nghĩa

5% và power 90%. Ta tính được số đối tượng nghiên cứu cần thiết là 113 người.

Thí dụ 3: Một nhà tâm lí học muốn tiến hành một thực nghiệm, trong đó sinh viên được hỏi

những câu hỏi để đo lường nhân cách (personality) và sự mong muốn xã hội (social

desirability). Nhà nghiên cứu muốn chứng tỏ rằng hai biến số này không có liên quan. Cần

nghiên cứu trên bao nhiêu sinh viên (David Machin, 1997)

Đầu tiên cần chỉ ra mức ý nghĩa của sai lầm loại 1 alpha. Trong tình huống này, nhà nghiên

18

cứu muốn giả định rằng hệ số tương quan bằng 0 khi hệ số tương quan này nhỏ và như vậy

chọn ngưỡng sai lầm loại 1 lớn là 0,2. Tuy nhiên ông ta muốn có sai lầm loại 2 tương đối nhỏ

và chọn beta=0,05. Ngoài ra nhà nghiên cứu muốn đặt giá trị của r mà nếu hệ số tương quan

nhỏ hơn số này thì xem như sự tương quan trên thực tế bằng không và ông ta đặt giá trị này là

0,1. Vì vậy số lượng sinh viên cần thiết là 854.

Thí dụ 4: Hệ số tương quan của 2 biến số được ước đoán là 0,6. cần bao nhiêu bệnh nhân để

hệ số tương quan này là có ý nghĩa thống kê (so với 0,0). Mức ý nghĩa được chọn là 0.05 và

lực mẫu là 0.90 (medCalc) ta có cỡ mẫu cần thiết là 25 người

Thí dụ 4: Hệ số tương quan của 2 biến số được ước đoán là 0,6. cần bao nhiêu bệnh nhân để

hệ số tương quan này là khác biệt có ý nghĩa thống kê so với ρ=0,2. Mức ý nghĩa được chọn

là 0.05 và lực mẫu là 0.90 ()

Như vậy, cần phải khảo sát 47 bệnh nhân. Kết quả này đã được kiểm chứng lại phần mềm

Sisa (http://www.quantitativeskills.com/sisa/statistics/correl.htm) và phần mềm StudySize 2.0

(Bertile Olofsson).

Kiểm định ý nghĩa của hệ số tương quan của hai mẫu

Đôi khi chúng ta cần so sánh hệ số tương quan r1 không phải với hệ số tương quan cho trước

(tham số của dân số) mà cần so sánh hệ số tương quan r1 ở một nhóm quần thể này với hệ số

tương quan r2 một nhóm quần thể khác. Khi đó cỡ mẫu cần thiết cho mỗi nhóm được tính

theo công thức sau

3

)()(

)(2

2

01

2

2/11

rzrz

zzn

với

1

11

1

1log5.0)(

r

rrz

và

2

22

1

1log5.0)(

r

rrz

Thí dụ: Nếu bệnh nhân bị tăng huyết áp nhẹ được sử dụng một loại thuốc, huyết áp giảm

xuống có liên quan đến giảm độ nhớt của máu với hệ số tương quan là 0,3 (r2=0,3). Giả sử

chúng ta tiến hành thử nghiệm tương tự với bệnh nhân tăng huyết áp nặng và mong đợi quan

sát được sự tương quan mạnh hơn giữa giảm huyết áp và giảm độ nhớt sau khi uống thuốc

(r1=0.5). Số bệnh nhân cần khảo sát để chứng tỏ sự khác biệt giữa hệ số tương quan ở nhóm

bệnh nhân tăng huyết nặng (r1=0.5) và hệ số tương quan bệnh nhân tăng huyết áp nhẹ (r2=0,3)

có thể được tính được cỡ mẫu cho cả 2 nhóm là 738 người.

Kết quả này đã được kiểm chứng trên phần mềm StudySize 2.0 (Bertile Olofsson).

Các điểm cần lưu ý trong tính cỡ mẫu

- Như đã nói ở trên, cách tính cỡ mẫu chỉ cho chúng ta một ước lượng thô của cõ mẫu cần

http://www.quantitativeskills.com/sisa/statistics/correl.htm

19

thiết bởi vì nó dựa trên sự ước đoán về giá trị của thông số, quyết định chủ quan của chúng ta

về hậu quả mà chúng ta muốn phát hiện và công thức được sử dụng là công thức gần đúng.

Do đó con số tính ra giúp chúng ta phân biệt giữa cỡ mẫu 50 và 100 chứ không phân biệt cỡ

mẫu 50 và 53.

- Chúng ta phải cân đối giữa điều chúng ta mong muốn và tính khả thi. Ðôi khi có thể dùng

công thức tính cỡ mẫu để đi ngược lại năng lực của nghiên cứu. Thí dụ nếu chúng ta có một

kinh phí hạn chế để thực hiện một nghiên cứu nên chỉ có một cỡ mẫu nhất định. Chúng ta có

thể tính ngược lại từ cỡ mẫu để biết năng lực của nghiên cứu. Nếu hóa ra năng lực của nghiên

cứu rất thấp (thí dụ như 20%) tốt nhất chung ta không nên tiến hành nghiên cứu vì chúng ta

đã nắm chắc kết quả thất bại.

- Nếu một nghiên cứu có nhiều mục tiêu thì cỡ mẫu đủ cho một mục tiêu này có thể không đủ

cho mục tiêu khác. Ðể tính cỡ mẫu, tốt nhất phải chú trọng vào biến số (hoặc những biến số

quan trọng nhất).

- Tính cỡ mẫu không khó, cái khó là phải cung cấp những giả định của nghiên cứu: sai lầm

loại một, năng lực, sự khác biệt mà chúng ta muốn phát hiện.

Bài tập:

Thí dụ 1: Cho một nghiên cứu bệnh chứng, sử dụng những giả định sau để tính cỡ mẫu

cho từng trường hợp

Năng lực của nghiên cứu = 90%; mức ý nghĩa = 5%; 1 bệnh cho một chứng

% chứng tiếp xúc với yếu tố nguy cơ

OR 5% 20% 50% 70% 90%

1.5 2346

2 244

5 46

10 50

1. Dựa trên phép tính cỡ mẫu hãy đưa ra khuyến cáo khi nào nên dùng nghiên cứu bệnh

chứng và khi nào không.

2. Hãy tính cỡ mẫu trong một nghiên cứu bệnh chứng có năng lực =90%, mức ý nghĩa =5%

OR= 2 và tỉ lệ tiếp xúc với yếu tố nguy cơ là 30%. Hãy tính cỡ mẫu khi có 1 chứng: 1 bệnh; 2

chứng: 1 bệnh; 3 chứng: 1 bệnh.

Thí dụ 2: Cho một nghiên cứu đoàn hệ, sử dụng những giả định sau để tính cỡ mẫu cho

từng trường hợp

Năng lực của nghiên cứu = 90%; mức ý nghĩa = 5%; nhóm có tiếp xúc= nhóm không tiếp

xúc

tỉ suất mắc bệnh trong nhóm không tiếp xúc với yếu tố nguy cơ

RR 0,1% 1% 5% 15% 30%

1.5 108,904

2 3300

3 207

5 15

1. Dựa trên phép tính cỡ mẫu hãy đưa ra khuyến cáo khi nào nên dùng nghiên cứu đoàn hệ và

khi nào không.

20

2. Hãy tính cỡ mẫu trong một nghiên cứu bệnh chứng có năng lực =90%, mức ý nghĩa =5%

OR= 2 và tỉ suất mắc bệnh là 5%. Hãy tính cỡ mẫu khi có nhóm không tiếp xúc = nhóm tiếp

xúc; nhóm không tiếp xúc = 2 nhóm tiếp xúc; nhóm không tiếp xúc = 3 nhóm tiếp xúc

Thí dụ 3: Phòng y tế huyện A. muốn kiểm tra báo cáo về tỉ lệ tiêm chủng của một xã là

80% bằng cách tiến hành một cuộc điều tra (với sai số tuyệt đối dưới 5%, độ tin cậy = 95%).

Nếu phòng y tế quyết định chọn mẫu bằng phương pháp chọn mẫu ngẫu nhiên thì cỡ mẫu cần

thiết là bao nhiêu? Nếu chọn theo cụm thì cỡ mẫu cần thiết là bao nhiêu?

Documents

Cách tính cỡ mẫu - · PDF file3 tỉ lệ p! Toàn bộ logic của vấn đề là ở chỗ chúng ta có thể ước đoán p trước lúc nghiên cứu một cách không