Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
12/20/13
1
Bài 7:
PHÂN TÍCH SỐ LIỆU
PGS.TS. Lưu Ngọc Hoạt
Viện YHDP và Y tế công cộng, ĐH Y Hà Nội
Câu hỏi 1. Với bộ số liệu dưới đây thì nên tính Trung bình hay
Trung vị? Tại sao? 12, 10, 14, 11, 16, 12, 13, 25, 80
2. Khi nào thì phải ngoại suy số liệu? 3. Khi nào thì áp dụng ước lượng, khi nào thì kiểm định
giả thuyết? 4. Khi nào cần áp dụng test ghép cặp? Cho ví dụ về loại
nghiên cứu cần áp dụng test ghép cặp? 5. Tại sao phải sử dụng test phi tham số? Điều kiện nào để có thể áp dụng được các test tham số?
6. Điều kiện để áp dụng test Khi Bình phương? Dùng test gì khi test Khi Bình phương không thích hợp?
QuÇn thÓ ®Ých"
QuÇn thÓ nghiªn cøu"
MÉu"
Tham sè quÇn thÓ "(µ, σ, P...)"MÉu x¸c suÊt"
- NgÉu nhiªn ®¬n !- NgÉu nhiªn hÖ thèng!- MÉu ph©n tÇng !- MÉu chïm !- MÉu nhiÒu bËc !
MÉu kh«ng x¸c suÊt"- MÉu kinh nghiÖm "- MÉu thuËn tiÖn !- MÉu chØ tiªu!- MÉu cã môc ®Ých."
Chän mÉu "
¦íc lîng "• ®iÓm"• kho¶ng "
KiÓm ®Þnh gi¶ thuyÕt"
Suy luËn th«ng kª (ChØ ¸p dông cho mÉu x¸c suÊt víi cì mÉu ®ñ lín) "
KÕt luËn ngo¹i suy !
C¸c test thèng kª
Gi¸ trÞ p
Lùa chän!
M« t¶ c¸c tham sè mÉu"(tr×nh bµy kÕt qu¶ nghiªn có) "
Tham sè mÉu"( , s, p...)!XBiÕn sè !
Thèng kª m« t¶ "
Thèng kª suy luËn" Ph©n biÖt thèng kª m« t¶ vµ thèng kª suy luËn
v Thèng kª m« t¶: ‒ lµ m« t¶ kÕt qu¶ thu ®îc tõ mÉu nghiªn cøu ‒ biÓu thÞ ®é lín, sù ph©n bè cña c¸c tham sè cña
mÉu nghiªn cøu nh , ®é lÖch chuÈn, c¸c tû lÖ, b¶ng, biÓu, ®å thÞ sù ph©n bè theo c¸c biÕn sè kh¸c nhau nh tuæi, giíi, ®Þa d...
v Thèng kª suy luËn: ‒ lµ qu¸ tr×nh ngo¹i suy kÕt qu¶ nghiªn cøu tõ mÉu
ra quÇn thÓ nghiªn cøu. ‒ bao gåm 2 ph¬ng ph¸p: íc lîng vµ kiÓm ®Þnh
X
12/20/13
2
1. Thèng kª m« t¶
Bµi tËp
Nếu một người nghiên cứu muốn thu thập số liệu về huyết áp tối đa của các đối tượng NC, cách thu thập nào dưới đây Anh/Chị cho là hợp lý nhất?
A. Phân huyết áp thành các nhóm (ví dụ < 90 mmHg; 90-120; 121-140...) sau đó chọn nhóm thích hợp
B. Ghi đầy đủ trị số huyết áp tối đa của từng đối tượng.
C. Phân đối tượng thành hai loại có và không cao huyết áp tối đa
D. Phân thành các nhóm: huyết áp thấp, bình thường, cao và rất cao
Bµi tËp
Nếu một người nghiên cứu muốn thu thập số liệu về số điếu thuốc lá một người hút trung bình/ngày, cách thu thập nào dưới đây Anh/Chị cho là hợp lý nhất?
A. Phân thành các nhóm (ví dụ < 5 điếu; 5-10; 11-15; 16-20...) sau đó chọn nhóm thích hợp
B. Ghi chính xác số điếu thuốc hút trung bình mà đối tượng đã trả lời.
C. Phân đối tượng thành hai loại: hút trên 1 bao hoặc dưới một bao
D. Phân thành các nhóm: hút nhẹ, hút trung bình, hút nhiều, hút rất nhiều.
¦u ®iÓm cña ph©n tÝch sè liÖu díi d¹ng ®Þnh lîng (vÝ dô c©n nÆng khi ®Î cña trÎ)
BA XX >>PA = PB = 10% "
2500 gr "
50 trÎ 450 trÎ
B
2500 gr "
50 trÎ 450 trÎ
A 2500 gr "
50 trÎ 450 trÎ
A
12/20/13
3
¦u ®iÓm cña ph©n tÝch sè liÖu díi d¹ng ®Þnh lîng (tiÕp) (Huyết ¸p tối đa)
PA = PB = 60% "
140 mmHg "
300 người 200 người
A
140 mmHg "
300 người 200 người
B
BA XX !
sB >> sA "
C¸c néi dung chÝnh cña thèng kª m« t¶
I. Tæng hîp c¸c biÕn sè"‒ Víi c¸c biÕn ®Þnh tÝnh:!
² TÇn sè (frequency)!
² Tû sè (ratio)!
² Tû lÖ (proportion)!
² Tû suÊt (rate)!
‒ Víi c¸c biÕn ®Þnh lîng: !
² §o lêng ®é tËp trung: gi¸ trÞ trung b×nh, trung vÞ, mèt!
² §o lêng ®é ph©n t¸n: ph¬ng sai, ®é lÖch chuÈn, "
C¸c néi dung chÝnh cña thèng kª m« t¶
II. Tr×nh bµy sè liÖu b»ng b¶ng: "‒ B¶ng 1 chiÒu "‒ B¶ng 2 chiÒu"
III. Tr×nh bµy sè liÖu b»ng biÓu vµ ®å thÞ "‒ §å thÞ cét: "
² Cét rêi, !² Cét chång, !² Cét liªn tôc !
‒ §å thÞ h×nh trßn"‒ BiÓu ®å gÊp khóc "‒ BiÓu ®å ®a gi¸c "‒ BiÓu ®å chÊm (®¸m m©y)"‒ B¶n ®å "
1/ Tæng hîp sè liÖu víi c¸c biÕn ®Þnh tÝnh
12/20/13
4
1.1. TÇn sè (frequency):
v BiÓu thÞ sè lÇn xuÊt hiÖn cña 1 quan s¸t nµo ®ã"v VD : Ph©n bè nhãm d©n téc trong sè 22 ngêi
nghiªn cøu.
22 "Tæng céng"
6"Nïng "
12 "Tµy"
4"Kinh "
TÇn sè"§Õm sè lÇn xuÊt hiÖn"Gi¸ trÞ biÕn "
1.2. Tû sè (ratio):
v Lµ ph©n sè mµ mÉu sè kh«ng bao hµm tö sè
n Tö sè vµ mÉu sè cã thÓ kh¸c nhau vÒ ®¬n vÞ ®o lêng
n HÖ sè k cã thÓ lµ 1, 10, 100, 1000... n VÝ dô:
a"--- x k " b"
sè häc sinh nam ----------------------sè häc sinh n÷
sè giêng bÖnh ----------------------------d©n sè trong khu vùc
1.3. Tû lÖ (proportion):
: Lµ 1 ph©n sè mµ mÉu sè bao hµm tö sè, do vËy c¶ mÉu vµ tö ®Òu ph¶i cïng ®¬n vÞ
a"------- x k "a + b"
n HÖ sè k cã thÓ lµ 1, 10, 100, 1000... n Khi k = 100, ta cã tû lÖ phÇn tr¨m (percentage)!
n VÝ dô:" sè häc sinh nam Tû lÖ häc sinh nam = ----------------------- tæng sè häc sinh
sè ngêi m¾c sèt rÐt Tû lÖ m¾c sèt rÐt = ---------------------------------- tæng sè ngêi ®îc kh¸m
1.4. Tû suÊt (rate):
v Lµ 1 d¹ng ®Æc biÖt cña tû lÖ khi nã ®îc ®o lêng trong mét kho¶ng thêi gian nhÊt ®Þnh
v VÝ dô:
sè biÕn cè xÈy ra trong 1 kho¶ng thêi gian ------------------------------------------------------------ x k d©n sè trung b×nh trong kho¶ng thêi gian ®ã
n HÖ sè k cã thÓ lµ 1, 10, 100, 1000... n VÝ dô:"
sè ngêi bÞ sèt rÐt t¹i huyÖn A n¨m 2000 ------------------------------------------------------------- x 100 d©n sè trung b×nh cña huyÖn A trong n¨m ®ã
12/20/13
5
2/ Tæng hîp sè liÖu víi c¸c biÕn ®Þnh lîng
2.1. §o lêng ®é tËp trung:
Bµi tËp
Tham số nào là thích hợp nhất để đo lường độ tập trung của bộ số liệu dưới đây: 12, 15, 17, 20, 23, 24, 26, 28, 80
A. Trung vị B. Khoảng phần trăm C. Giá trị trung bình D. Độ lệch chuẩn
v §îc tÝnh b»ng tæng sè c¸c gi¸ trÞ quan s¸t ®îc chia cho sè lÇn quan s¸t.
v Gi¸ trÞ trung b×nh chØ tÝnh ®îc víi c¸c sè d¹ng liÖu sè (biÕn ®Þnh lîng)
v VÝ dô:!
‒ ChiÒu cao cña 7 em g¸i ®o ®îc nh sau:
‒ 141, 141, 143, 144, 145, 146, 155 cm (tæng céng tÊt c¶ chiÒu cao lµ 1015 cm)
‒ V× vËy trung b×nh b»ng 1015/7, tøc lµ 145 cm.
n
X
nXXXX
n
ii
n!==
+++= 121 ...
v Trung b×nh sè häc (trung b×nh céng):
v Lµ gi¸ trÞ gi÷a cña 1 bé sè liÖu khi chóng ®îc s¾p xÕp theo thø tù t¨ng dÇn hoÆc gi¶m dÇn.
v Gi¸ trÞ nµy chia sù ph©n bè cña sè liÖu thµnh hai phÇn b»ng nhau
!
v VÝ dô:!‒ ta cã bé sè liÖu: 47, 41, 44, 43, 42, 40, 72 kg.
‒ ®Ó tÝnh trung vÞ, tríc hÕt s¾p xÕp sè liÖu theo thø tù: 40, 41, 42, 43, 44, 47, 72 kg.
‒ trung vÞ sÏ lµ gi¸ trÞ cña quan s¸t thø (n+1)/2, tøc lµ (7+1)/2 =4, vµ gi¸ trÞ thø 4 = 43 kg lµ trung vÞ.
‒ Víi bé sè liÖu: 40, 41, 42, 43, 44, 47, 49 vµ 72 th× trung vÞ lµ gi¸ trÞ trung b×nh céng cña gi¸ trÞ thø 4 vµ thø 5 = (43+44)/2 = 43,5
v Trung vÞ (gi¸ trÞ trung t©m):
12/20/13
6
v Lµ gi¸ trÞ quan s¸t ®îc nhiÒu lÇn nhÊt trong bé sè liÖu v Trong bé sè liÖu díi ®©y:141, 141, 143, 144, 145, 146,
155 th× 141 ®îc coi lµ mèt v× quan s¸t ®îc nhiÒu lÇn nhÊt.
v Mèt Ýt cã gi¸ trÞ trong ®o lêng ®é tËp trung cña bé sè liÖu khi ë d¹ng ®Þnh lîng, nhng cã gi¸ trÞ víi bé sè liÖu ph©n nhãm, hoÆc biÕn ®Þnh tÝnh
v VÝ dô: Trong b¶ng díi, nhãm tuæi 36-45 lµ mèt
Nhãm tuæi TÇn sè Nhãm tuæi TÇn sè Nhãm tuæi TÇn sè
< 5 15 26-35 67 56-65 43
5-15 24 36-45 120 66-75 27
16-25 32 46-55 94 >75 12
v Mèt: Ph©n biÖt vÒ gi¸ trÞ trung b×nh, trung vÞ vµ mèt:
Mèt = 10 "Trung vÞ = 11 "Trung b×nh = 11,3 "
§o lêng (cm)"
VÝ dô ph©n bè chuÈn
Freq
uenc
y
bwt 709 " 4990 "
0 "
29 "
Ph©n biÖt vÒ gi¸ trÞ trung b×nh, trung vÞ vµ mèt (tiÕp):
v Gi¸ trÞ trung b×nh ®îc sö dông thêng xuyªn h¬n vµ cã gi¸ trÞ khi bé sè liÖu lµ 1 ph©n bè chuÈn."
v Khi bé sè liÖu ph©n bè kh«ng chuÈn, trung vÞ cã ý nghÜa h¬n:"
v VÝ dô: !
‒ Víi bé sè liÖu nµy: 40, 41, 42, 43, 44, 47, 72 th× gi¸ trÞ trung b×nh = 47, trong khi gi¸ trÞ trung vÞ b»ng 43.
‒ NÕu ta thay gi¸ trÞ 72 trong bé sè liÖu trªn = 51, gi¸ trÞ trung vÞ kh«ng ®æi, nhng gi¸ trÞ trung b×nh chØ cßn lµ 44!
12/20/13
7
2/ Tæng hîp sè liÖu víi c¸c biÕn ®Þnh lîng (tiÕp)
2.2. §o lêng ®é ph©n t¸n:
v Kho¶ng sè liÖu (range): "‒ Lµ hiÖu gi÷a hai gi¸ trÞ ®o lêng cao nhÊt vµ thÊp nhÊt
trong mét bé sè liÖu. ‒ Kho¶ng sè liÖu (R) = Xmax ‒ Xmin
v VÝ dô: nÕu c©n nÆng cña 7 phô n÷ lµ 40, 41, 42, 43, 44, 47 vµ 72 kg, kho¶ng quan s¸t sÏ lµ 72 - 40 = 32 kg."
1
)(1
2
2
!
!="=
n
XXis
n
i
v Ph¬ng sai (variance)"
‒ Lµ tæng b×nh ph¬ng c¸c kho¶ng c¸ch gi÷a gi¸ trÞ quan s¸t so víi gi¸ trÞ trung b×nh chia cho sè c¸c quan s¸t trõ ®i 1.
v §é lÖch chuÈn (standard deviation)"
2ss =
v VÝ dô minh ho¹:
X
v VÝ dô minh ho¹ (tiÕp):
6
10
0
30
Σ
1 2 1 0 4 B×nh ph¬ng kho¶ng chªnh lÖch gi÷a gi¸ trÞ quan s¸t so víi gi¸ trÞ trung b×nh
1 2 -1 0 -2 Kho¶ng chªnh lÖch so víi gi¸ trÞ trung b×nh
7 8 5 6 4 Tû lÖ phô n÷ lµm kinh tÕ giái (Xi)
01 00 99 98 97
)( XXi !
5,2410
1
)(1
2
2 ==!
!="=
n
XXis
n
i
X
2)( XXi !
58,15,2 ==! s
12/20/13
8
v HÖ sè biÕn thiªn (coeficient of variation)"v Lµ tû sè gi÷a ®é lÖch chuÈn vµ trÞ tuyÖt ®èi cña gi¸ trÞ trung
b×nh
v HÖ sè biÕn thiªn ®îc biÓu thÞ b»ng tû lÖ phÇn tr¨m (%) vµ biÓu thÞ møc ®é biÕn thiªn cña ®é lÖch chuÈn so víi gi¸ trÞ trung b×nh
v Gióp cho viÖc so s¸nh møc ®é ph©n t¸n cña nhiÒu bé sè liÖu víi nhau:
v VÝ dô:!
v CV cña c©n nÆng nam =12/60 = 20% v CV cña c©n nÆng n÷ = 8/54 = 15% v VËy bé sè liÖu cña c©n nÆng nam ph©n t¸n h¬n
XsCV =
8 54 C©n nÆng n÷ thanh niªn 12 60 C©n nÆng nam thanh niªn s X
v Thèng kª m« t¶: Quan t©m ®Õn mÉu NC ‒ Tæng hîp sè liÖu:
² tû lÖ, tû sè, tû suÊt ² §é tËp trung, ®é ph©n t¸n cña bé sè liÖu ®Þnh lîng
‒ Tr×nh bµy kÕt qu¶ nghiªn cøu: ² B¶ng ² BiÓu ®å, ®å thÞ
v Thèng kª suy luËn: quan t©m ®Õn quÇn thÓ ‒ ¦íc lîng :
² §iÓm, ² Kho¶ng
‒ KiÓm ®Þnh gi¶ thuyÕt ² Kh¸c nhau ² T¬ng quan
2. Thèng kª suy luËn
2.1. ¦íc lîng ®iÓm, kho¶ng"
Ph©n biÖt íc lîng vµ kiÓm ®Þnh
v íc lîng: ‒ ngo¹i suy tõ tham sè mÉu ra tham sè quÇn thÓ:
‒ tõ trung b×nh cña mÉu ( ) sang TB quÇn thÓ (µ)
‒ tõ tû lÖ cña mÉu (p) sang tû lÖ cña quÇn thÓ (P) ‒ tõ OR, RR, r cña mÉu ra quÇn thÓ.
v KiÓm ®Þnh gi¶ thuyÕt: ‒ so s¸nh 2 hoÆc nhiÒu quÇn thÓ NC tõ sù kh¸c biÖt
cña 2 hoÆc nhiÒu mÉu rót ra tõ c¸c quÇn thÓ ®ã. ‒ kiÓm ®Þnh mèi t¬ng quan cña quÇn thÓ dùa theo
mèi t¬ng quan thu ®îc tõ mÉu
X
12/20/13
9
VÝ dô: C©n nÆng khi ®Î cña trÎ míi sinh t¹i huyÖn A: tham sè mÉu vµ quÇn thÓ
TrÎ s¬ sinh" t¹i huyÖn A"
5000 trÎ "
MÉu"500 trÎ "
12802954±=± sXTham sè mÉu:
??±=±!µTham sè QT:
íc lîng hay kiÓm ®Þnh?
VÝ dô: C©n nÆng khi ®Î cña trÎ míi sinh t¹i huyÖn A: tham sè mÉu vµ quÇn thÓ
TrÎ s¬ sinh" t¹i huyÖn A "
5000 trÎ "
MÉu"500 trÎ "
Tû lÖ trÎ (p) cã c©n nÆng < 2500 gram = 20%
íc lîng hay kiÓm ®Þnh?
Tû lÖ trÎ (P) cã c©n nÆng < 2500 gram = ?
VÝ dô: C©n nÆng khi ®Î cña trÎ míi sinh t¹i huyÖn A vµ huyÖn B
TrÎ s¬ sinh" t¹i huyÖn A"
5000 trÎ "
TrÎ s¬ sinh" t¹i huyÖn B "
6000 trÎ "
MÉu"500 trÎ "
MÉu B "500 trÎ "
?
12802954± 8862785±>íc lîng hay kiÓm ®Þnh?
* ¦íc lîng ®iÓm:"X=µ
P = p !+ Víi biÕn ®Þnh lîng: è
+ Víi biÕn ®Þnh tÝnh: è
n Nhîc ®iÓm cña íc lîng ®iÓm:
n VÝ dô ®iÓm thi cña 9 sinh viªn
Sinh viªn sè 1 2 3 4 5 6 7 8 9
§iÓm ®¹t ®îc 9 8 7 9 6 4 5 8 3
NÕu coi 9 sinh viªn nµy lµ 1 quÇn thÓ è
56,69
385469789=
++++++++=µ
NÕu chän ngÉu nhiªn1 mÉu cã 2 SV, ta sÏ cã 36 c¬ héi.
N!"---------"
n!(N-n)!"
12/20/13
10
* ¦íc lîng ®iÓm (tiÕp) MÉu sè:
CÆp sinh viªn sè:
§iÓm cña tõng sinh viªn
§iÓm trung b×nh cña 2 sinh viªn
1
1, 2
9
8
8,5
2
1, 3
9
7
8,0
3
1, 4
9
9
9,0
4
1, 5
9
6
7,5
5
1, 6
9
4
6,5
6
1, 7
9
5
7,0
7
1, 8
9
8
8,5
8
1, 9
9
3
6,0
9
2, 3
8
7
7,5
10
2, 4
8
9
8,5
11
2, 5
8
6
7,0
12
2, 6
8
4
6,0
36
8,9
8
3
5,5
* ¦íc lîng ®iÓm (tiÕp)
1 1
2 2
4
5 5
4 4
3
4
10
1
2
3
4
5
3.5 4 4.5 5 5.5 6 6.5 7 7.5 8 8.5 9
TÇn sè quan s¸t víi c¸c trung b×nh mÉu kh¸c nhau (ph©n bè mÉu):
TB mÉu 3,5 4,0 4,5 5,0 5,5 6,0 6,5 7,0 7,5 8,0 8,5 9,0
TÇn sè 1 1 2 2 4 5 5 4 4 3 4 1
VÝ dô ph©n bè chuÈn
Freq
uenc
y
bwt 709 " 4990 "
0 "
29 "
* ¦íc lîng kho¶ng
+ Víi biÕn ®Þnh lîng: è
+ Víi biÕn ®Þnh tÝnh: è
+ C«ng thøc tæng qu¸t:
Tham sè quÇn thÓ = tham sè mÉu ±Zα/2.SE
SE (Sai sè chuÈn) = ®é lÖch chuÈn cña c¸c trung b×nh mÉu
¦íc lîng kho¶ng cßn dïng víi nhiÒu tham sè mÉu kh¸c nh OR, RR, r...
nsZX 2/!µ ±=
nppZpP )1.(
2/!
±= "
12/20/13
11
* Nguyªn lý íc lîng kho¶ng vµ kho¶ng tin cËy
µ
2.2. KiÓm ®Þnh gi¶ thuyÕt"
* So s¸nh sù kh¸c nhau gi÷a 2 nhãm "
VÝ dô 2: So s¸nh c©n nÆng khi ®Î cña trÎ míi sinh t¹i huyÖn A so víi huyÖn B:
TrÎ s¬ sinh" t¹i huyÖn A "
5000 trÎ "
TrÎ s¬ sinh" t¹i huyÖn B "
6000 trÎ "
MÉu A "500 trÎ "
MÉu B "500 trÎ "
1. Khi c©n nÆng cña trÎ díi d¹ng gram"
TrÎ s¬ sinh" t¹i huyÖn A "
5000 trÎ "
TrÎ s¬ sinh" t¹i huyÖn B "
5000 trÎ "
MÉu A "500 trÎ "
MÉu B "500 trÎ "
?
Test t!
12802954± 8862785±>
12/20/13
12
2. Khi c©n nÆng cña trÎ díi d¹ng < hoÆc ≥ 2500 gram"
TrÎ s¬ sinh" t¹i huyÖn A "
5000 trÎ "
TrÎ s¬ sinh" t¹i huyÖn B "
5000 trÎ "
MÉu A "500 trÎ "
MÉu B "500 trÎ "
>"
?
Test χ2 hoÆc Fisher test!
pA = 25% pB = 22%
2.2. KiÓm ®Þnh gi¶ thuyÕt"
* So s¸nh sù kh¸c nhau gi÷a > 2 nhãm "
TrÎ s¬ sinh" t¹i huyÖn A "
5000 trÎ "
TrÎ s¬ sinh" t¹i huyÖn B "
5000 trÎ "
MÉu A "500 trÎ "
MÉu B "500 trÎ "
12802954± 10242645±>
1. Víi biÕn ®Þnh lîng"
TrÎ s¬ sinh" t¹i huyÖn C "
5000 trÎ "
MÉu C "500 trÎ "
8862785±<
? ?
Test ANOVA "
TrÎ s¬ sinh" t¹i huyÖn A "
5000 trÎ "
TrÎ s¬ sinh" t¹i huyÖn B "
5000 trÎ "
MÉu A "500 trÎ "
MÉu B "500 trÎ "
>
2. Víi biÕn ®Þnh tÝnh"
TrÎ s¬ sinh" t¹i huyÖn C "
5000 trÎ "
MÉu C "500 trÎ "
>
? ?
Test χ2 "
pA = 25% pB = 21% pc = 16%
12/20/13
13
Kh«ng "ghÐp cÆp "
t test !cho cÆp"
test t-student hoÆc Z test "
Khi so s¸nh trªn 2 nhãm "
ANOVA "(F test) "
Ph©n tÝch sù"kh¸c nhau
BiÕn ®Þnh tÝnh"
BiÕn ®Þnh lîng"
GhÐp cÆp "
Kh«ng "ghÐp cÆp "Víi tÊt c¶
c¸c lo¹i nghiªn cøu"
McNemar’s test (χ2) "
χ2 hoÆc Fisher test "
Khi so s¸nh " 2 nhãm"
GhÐp cÆp "
Kh«ng "ghÐp cÆp "
GhÐp cÆp " t test !cho cÆp"
Tæng hîp ph©n tÝch sù kh¸c nhau
2.2. KiÓm ®Þnh gi¶ thuyÕt"
KiÓm ®Þnh mèi t¬ng quan gi÷a 2 biÕn nhÞ ph©n "
KiÓm ®Þnh mèi quan hÖ nh©n qu¶
Ph©n tÝch Sù "T¬ng quan"
§o lêng ®é lín cña mèi tư¬ng quan "
BiÕn nhÞ ph©n"
BiÕn ®Þnh lîng"
NC ngang/ "NC bÖnh-chøng"
Tû suÊt chªnh (OR)"
NC thuÇn tËp/"NC Thö nghiÖm "
Nguy c¬ tư¬ng ®èi (RR) vµ OR!
Víi tÊt c¶ c¸c lo¹i nghiªn cøu"
Ph©n tÝch tư¬ng quan vµ håi quy "
Test ý nghÜa TK cña mèi tư¬ng quan "
BiÕn nhÞ ph©n"
Víi tÊt c¶ c¸c lo¹i nghiªn cøu"
χ2 hoÆc χ2 cña
McNemar’s "
Ph©n tÝch tư¬ng quan vµ håi quy "
"
Víi tÊt c¶ c¸c lo¹i nghiªn cøu"
"
BiÕn ®Þnh lîng"
M«Ý liªn quan gi÷a tuæi vµ huyÕt ¸p tèi ®a "
sbp
age 17 70 110
220 - HÖ sè t¬ng quan r
- Ph¬ng tr×nh håi quy tuyÕn tÝnh
12/20/13
14
B¶ng lùa chän test thèng kª BiÕn ®éc
lËp BiÕn Phô thuéc
1 biÕn ®Þnh tÝnh >2 biÕn ®Þnh tÝnh
1 ®Þnh lưîng
1 ®Þnh tÝnh, 1 ®Þnh
lưîng
NhiÒu biÕn ®Þnh tÝnh vµ/hoÆc
®Þnh lîng
Cã 2 nhãm
Trªn 2 nhãm
1 biÕn ®Þnh lưîng
Test t Test ANOVA
Factorial design (thõa sè)
HÖ sè tư¬ng quan r hoÆc håi quy tuyÕn tÝnh
ANCOVA Ph©n tÝch håi quy ®a biÕn
1 biÕn nhÞ ph©n
OR, RR, χ2 hoÆc Fisher test
χ2 hoÆc Fisher test
Ph©n tÝch tÇng
Test t Factorial design (thõa sè)
Håi quy logistics
1 biÕn ®Þnh tÝnh
χ2 hoÆc Fisher test
χ2 hoÆc Fisher test
Ph©n tÝch tÇng
ANOVA Factorial design (thõa sè)
Mét sè test thêng dïng
Ø Test t student:
Ø Test Khi b×nh ph¬ng
Ø Test ANOVA
Ø Håi quy vµ hÖ sè t¬ng quan
Ø Test Khi b×nh ph¬ng cña Mc. Nemar
Ø Test t ghÐp cÆp
Ø Mét sè test phi tham sè kh¸c nh test Mann-Whitney U test, Wilcoxon signed-rank test
)( 2!
Test t ghÐp cÆp
x1 x2 d = x1 ‒ x2
1,5 1,7 - 0,2
1,7 1,9 - 0.2
2,1 2,2 - 0,1
1,6 1,9 - 0,3
2,4 2,4 0
Tæng - 0,8
- 0,8/5 = - 0,16 d
Chøc n¨ng h« hÊp cña 5 bÖnh nh©n hen trưíc vµ sau khi dïng thuèc !
( )
( ).14,3
051,016,0
051,05114,0
114,0)}1/(])({[ 2
!=!
==
===
=
!!"=
d
d
d
d
SEdt
nsSE
sndds
Tra b¶ng t víi ®é tù do "
n - 1 = 4, ta cã p < 0,04 "§K: Ph©n bè cña d ph¶i chuÈn
Test cña Mc. Nemar
Tríc ®iÒu trÞ Tæng
ThÊp BT
Sau ®iÒu trÞ
ThÊp a b a + b
BT c d c + d
Tæng a + c b + d
2!
;cbOR =
Chøc n¨ng h« hÊp cña bÖnh nh©n hen trưíc vµ sau khi dïng thuèc
cbcb+
!=
22 )(
"
12/20/13
15
Mann-Whitney U test v ChØ ®Þnh: So s¸nh 2 nhãm ®éc lËp khi sè liÖu lµ
®Þnh lîng hoÆc thø h¹ng, ph©n bè kh«ng chuÈn
• VÝ dô: So s¸nh t¸c dông ®iÒu trÞ ®au ®Çu cña Aspirin vµ placebo th«ng qua viÖc tù cho ®iÓm cña bÖnh nh©n
Aspirin n=8 7,5 8,3 9,1 6,2 5,4 8,3 6,5 8,4
Placebo n=10 3,1 5,6 4,5 6,2 5,1 5,3 5,5 4,1 4,3 4,2
• XÕp thø tù c¸c gi¸ trÞ ®iÓm trªn kh«ng ph©n biÖt nhãm
Quan s¸t 3,1 4,1 4,2 4,3 4,5 5,1 5,3 5,4 5,5
Thø tù 1 2 3 4 5 6 7 8 9
Quan s¸t 5,6 6,2 6,2 6,5 7,5 8,3 8,3 8,4 9,1 Thø tù 10 11,5 11,5 13 14 15,5 15,5 17 18
Mann-Whitney U test (tiÕp) v TÝnh tæng xÕp h¹ng cña nhãm ®iÒu trÞ (aspirin): v T = 8+11,5+13+14+15+16+17+18 = 112,5 v TÝnh Z theo c«ng thøc:
v Tra b¶ng Z ta ®îc p <0,003
]12/)1([2/)1(
2121
211
++
++!=
nnnnnnnTZ
24,3]12/)1108(108[2/)1108(85,112=
++
++!=
xZ
Wilcoxon signed-rank test v ChØ ®Þnh: So s¸nh 2 nhãm ghÐp cÆp khi sè liÖu lµ
®Þnh lîng hoÆc thø h¹ng, ph©n bè kh«ng chuÈn
• VÝ dô: So s¸nh ¶nh hëng cña sè n¨m uèng thuèc tr¸nh thai trªn bÖnh K vó trong 1 NC bÖnh-chøng ghÐp cÆp
CÆp 1 2 3 4 5 6 7 8 9 10
Ung th 2,0 10,0 7,1 2,3 3,0 4,1 10,0 10,5 12,1 15,0
Chøng 1,5 9,1 8,1 1,5 3,1 5,2 1,0 9,6 7,6 9,0
Chªnh lÖch 0,5 0,9 -1,0 0,8 -0,1 -1,1 9,0 0,9 4,5 6,0
Bá dÊu 0,5 0,9 1,0 0,8 0,1 1,1 9,0 0,9 4,5 6,0
Thø tù 2 4,5 6 3 1 7 10 4,5 8 9
Thø tù cã dÊu 2 4,5 -6 3 -1 -7 10 4,5 8 9
Wilcoxon signed-rank test (tiÕp)
v TÝnh tæng thø h¹ng mang dÊu d¬ng T (bá c¸c thø h¹ng mang dÊu ©m):
v T = 2 + 4,5 + 3 + 10 + 4,5 + 8 + 9 = 41,0 v ¸p dông c«ng thøc:
v Tra b¶ng Z ta cã p = 0,16
]24/)12)(1([4/)1(
++
+!=
nnnnnTZ
4,1]24/)120)(110(10[
4/)110(1041=
++
+!=Z
12/20/13
16
Ph©n tÝch håi quy vµ t¬ng quan trong NCKH
C¸c bíc x¸c ®Þnh mèi t¬ng quan gi÷a 2 biÕn ®Þnh lîng
1. Chän biÕn thÝch hîp ®Ó x¸c ®Þnh mèi t¬ng quan:!
2. BiÓu thÞ mèi t¬ng quan gi÷a 2 biÕn thÝch hîp b»ng biÓu ®å chÊm:!
3. ViÕt ph¬ng tr×nh håi quy tuyÕn tÝnh nÕu thÝch hîp !
4. X¸c ®Þnh hÖ sè t¬ng quan (r)!
1. Chän biÕn thÝch hîp ®Ó x¸c ®Þnh mèi t¬ng quan:
* VÝ dô nµo díi ®©y lµ thÝch hîp ®Ó x¸c ®Þnh mèi t¬ng quan gi÷a 2 biÕn ®Þnh lîng:
v Hµm lîng chÊt ®éc trong m¸u vµ chÊt ®éc trong níc tiÓu trªn 1 nhãm ®èi tîng nghiªn cøu !
v Hµm lîng mì trong thøc ¨n vµ hµm lîng mì trong m¸u cña ngêi ¨n thêng ¨n thøc ¨n ®ã,!
v Sè lîng hång cÇu trong m¸u vµ ®é cao n¬i ngêi ®ã sèng so víi mÆt biÓn !
v ChiÒu cao thanh niªn gi÷a vïng thµnh thÞ vµ n«ng th«n !
v ChiÒu cao cña bè liªn quan ®Õn chiÒu cao cña con !
2. BiÓu thÞ mèi t¬ng quan gi÷a 2 biÕn thÝch hîp b»ng biÓu ®å chÊm:
v VÏ ®å thÞ v Quan s¸t ®å thÞ, m« t¶ mèi t¬ng quan:
Ø Cã t¬ng quan hay kh«ng? !
Ø T¬ng quan lµ tuyÕn tÝnh hay kh«ng? !
Ø T¬ng quan tuyÕn tÝnh cã râ rµng hay kh«ng? !
Ø T¬ng quan lµ thuËn hay nghÞch !
Ø Cã thÓ viÕt ph¬ng tr×nh håi quy tuyÕn tÝnh cho mèi t¬ng quan hay kh«ng? !
Ø Lµm thÕ nµo ®Ó c¶i thiÖn vµ x¸c ®Þnh ®óng mèi t¬ng quan gi÷a hai biÕn sè nµy? !
² B»ng biÖn ph¸p lµm s¹ch sè liÖu? ² B»ng c¸ch t¸ch chia nhá bé sè liÖu?
12/20/13
17
gr sbp age:
sbp
age 17 70 110
220
gr sbp age, s([_n])
drop in 70
sbp
age 17 70 110
220
1
2
3 4
5
6
7
8
9 10
11 12
13
14
15 16 17
18 19 20
21 22
23 24
25 26
27
28 29
30
31 32
33 34
35
36 37
38 39
40
41 42
43
44
45
46
47
48 49
50 51
52
53
54 55 56
57 58 59
60 61
62 63
64 65
66
67 68
69
70
sbp
age 17 70 110
185
- predict yhat - gr sbp yhat age, c(.l)
age
sbp
Fitted values
17 70 110
185
12/20/13
18
3. Ph¬ng tr×nh håi quy tuyÕn tÝnh
3.1. ViÕt ph¬ng tr×nh: "D¹ng tæng qu¸t: * 'y = a + bx '!trong ®ã: *!v X gi¸ trÞ cña biÕn ®éc lËp !v Y gi¸ trÞ cña biÕn phô thuéc øng víi gi¸ trÞ X !v b hÖ sè håi quy biÓu thÞ ®é dèc cña ®êng håi quy:"
v a lµ sè chÆn ®îc tÝnh b»ng c«ng thøc: "v Gi¸ trÞ a lµ b»ng y khi x b»ng 0 (zero). !
! !! ! !
!!
"
"=
"
""=
nx
x
nyx
yx
xx
yyxxb
ii
iiii
22
2 )(
))((
)())((
xbya !=
3.2. Xem xÐt mèi liªn quan gi÷a Y vµ X cã ý nghÜa thèng kª hay kh«ng?
v KiÓm ®Þnh víi test t theo c«ng thøc: "
v Tra b¶ng t víi ®é tù do = n - 2 ®Ó x¸c ®Þnh t t¬ng øng víi α"
v KÕt luËn dùa vµo sù kh¸c biÖt gi÷a t tra tõ b¶ng vµ t tÝnh tõ c«ng thøc."
2
222
)()2()()()(
XXnXXbYY
bbSEbt
!!
!!!==
"" "
3.3. ¦íc lîng hÖ sè håi quy b tõ mÉu ra quÇn thÓ:
v HÖ sè håi quy cña quÇn thÓ ®îc ký hiÖu lµ β "v Sè chÆn cña quÇn thÓ ®îc ký hiÖu lµ α "v C«ng thøc íc lîng kho¶ng cho hÖ sè håi
quy β cña quÇn thÓ: " "
v * Chó ý: HÖ sè håi quy β vµ sè chÆn α nµy kh¸c víi α vµ β trong x¸c ®Þnh ®é tin cËy "
2
222
2/ )()2()()(
XXnXXbYY
tb!!
!!!±
"" "
#
ViÕt ph¬ng tr×nh håi quy theo STATA: LÖnh: reg sbp age
Source | SS df MS Number of obs = 69 ---------+------------------------------ F( 1, 67) = 121.27 Model | 14951.2546 1 14951.2546 Prob > F = 0.0000 Residual | 8260.51351 67 123.291246 R-squared = 0.6441 ---------+------------------------------ Adj R-squared = 0.6388 Total | 23211.7681 68 341.349531 Root MSE = 11.104
-------------------------------------------------------------------- sbp | Coef. Std. Err. t P>|t| [95% Conf. Interval] ---------+---------------------------------------------------------- age | .9833276 .0892947 11.012 0.000 .8050947 - 1.161561 _cons | 103.3491 4.331896 23.858 0.000 94.70256 - 111.9956 ----------------------------------------------------------
• HuyÕt ¸p tèi ®a = 103,35 + 0,98 tuæi"
• BiÕn tuæi ®ãng gãp 64% sù biÕn ®æi cña huyÕt ¸p tèi ®a "
12/20/13
19
* §iÒu kiÖn ®Ó cã thÓ viÕt ®îc ph¬ng tr×nh håi quy gi÷a 2 biÕn ®Þnh lîng
v BiÓu ®å chÊm thÓ hiÖn mèi t¬ng quan tuyÕn tÝnh râ"v Cã 1 mèi quan hÖ nh©n qu¶ gi÷a 2 biÕn "v BiÕn x ®îc lùa chän bëi ngêi nghiªn cøu (kh«ng
ngÉu nhiªn) trong khi biÕn y lµ ngÉu nhiªn."v Ph©n bè c¸c gi¸ trÞ cña c¶ biÕn x vµ y ph¶i chuÈn, "v Mét gi¸ trÞ cña x thêng cho 1 tËp hîp c¸c gi¸ trÞ cña y
vµ chóng ph¶i cã c¸c ®iÒu kiÖn sau:"Ø C¸c tËp hîp nµy ph¶i ®îc ph©n bè chuÈn!Ø Chóng cã cïng gi¸ trÞ ph¬ng sai!Ø Gi¸ trÞ trung b×nh cña c¸c tËp hîp nµy ph¶i n»m trªn 1 ®
êng th¼ng (chÝnh lµ ®êng håi quy)!
v C¸c gi¸ trÞ y lµ ®éc lËp víi nhau, tøc lµ kh«ng phô thuéc vµo c¸c gi¸ trÞ kh¸c nhau cña x."
4. HÖ sè t¬ng quan (r) v ChØ ¸p dông víi 2 biÕn ®Þnh lîng cã quan hÖ
nh©n qu¶, tuy nhiªn kh«ng cÇn biÕt biÕn nµo lµ phô thuéc hoÆc ®éc lËp !
!4.1. §o lêng ®é lín cña t¬ng quan: "v HÖ sè t¬ng quan "
v HoÆc: ! !!
""
""=
22 )()(
))((
YYXX
YYXXr
! !! !! ! !
""
"=
2222 )()(
))((
iiii
iiii
yynxxn
yxyxnr
4.2. Mét sè ®Æc tÝnh cña hÖ sè tư¬ng quan (r):
v ChØ biÓu thÞ mèi t¬ng quan tuyÕn tÝnh!v r dao ®éng trong kho¶ng tõ -1 ®Õn +1. !v r cµng gÇn 1 hoÆc - 1 th× mèi t¬ng quan gi÷a
2 biÕn cµng lín; !v r cµng gÇn 0 (zero) th× t¬ng quan cµng nhá. !
v Khi r = 0, hai biÕn kh«ng cã sù t¬ng quan tuyÕn tÝnh (nhng cã thÓ cã t¬ng quan d¹ng kh¸c).!
v r lµ hÖ sè t¬ng quan x¸c ®Þnh tõ mÉu, trong khi hÖ sè t¬ng quan cña quÇn thÓ lµ rho (ρ). !
4.3. KiÓm ®Þnh gi¶ thuyÕt cho gi¸ trÞ r:
v Gi¶ thuyÕt *Ho: *ρ = 0 "* * * *Ha: *ρ ≠ 0"
v Test thèng kª: * "
v Tra b¶ng t-student víi ®é tù do = n - 2 vµ α t¬ng øng. "
v KÕt luËn: NÕu t tÝnh tõ c«ng thøc > t tra tõ b¶ng à tøc lµ p < α; Ho bÞ lo¹i bá vµ mèi t¬ng quan gi÷a 2 biÕn cã ý nghÜa thèng kª vµ ngîc l¹i. *"
22 12
)2()1()( r
nr
nrr
rSErt
!
!=
!!
==
12/20/13
20
4.4. HÖ sè t¬ng quan vµ hÖ sè x¸c ®Þnh:
v Tham sè mÉu: *""v Tham sè quÇn thÓ: *""v ý nghÜa cña hÖ sè x¸c ®Þnh: "
2rr =2!! =
r2 = 0,25 r2 = 0,15 r2 = 0,50
Y Y Y X X X
5. VÝ dô vÒ mét sè bé sè liÖu kh«ng thÝch hîp víi håi quy vµ t¬ng quan:
X1 ! Y1 ! X2 ! Y2 ! X3 ! Y3 ! X4 ! Y4 !10 " 8.04 " 10 " 9.14 " 10 " 7.46 " 8 " 6.58 "8 " 6.95 " 8 " 8.14 " 8 " 6.77 " 8 " 5.76 "13 " 7.58 " 13 " 8.74 " 13 " 12.74 " 8 " 7.71 "9 " 8.81 " 9 " 8.77 " 9 " 7.11 " 8 " 8.84 "11 " 8.33 " 11 " 9.26 " 11 " 7.81 " 8 " 8.47 "14 " 9.96 " 14 " 8.1 " 14 " 8.84 " 8 " 7.04 "6 " 7.24 " 6 " 6.13 " 6 " 6.08 " 8 " 5.25 "4 " 4.26 " 4 " 3.1 " 4 " 5.39 " 19 " 12.5 "12 " 10.84 " 12 " 9.13 " 12 " 8.15 " 8 " 5.56 "7 " 4.82 " 7 " 7.26 " 7 " 6.42 " 8 " 7.91 "5 " 5.68 " 5 " 4.74 " 5 " 5.73 " 8 " 6.89 "
- LÖnh: reg y1 x1 Source | SS df MS Number of obs = 11 ---------+------------------------------ F( 1, 9) = 17.99 Model | 27.5100011 1 27.5100011 Prob > F = 0.0022 Residual | 13.7626904 9 1.52918783 R-squared = 0.6665 ---------+------------------------------ Adj R-squared = 0.6295 Total | 41.2726916 10 4.12726916 Root MSE = 1.2366 -------------------------------------------------------------------- y1 | Coef. Std. Err. t P>|t| [95% Conf. Interval] ---------+---------------------------------------------------------- x1 | .5000909 .1179055 4.241 0.002 .2333701 - .7668117 _cons | 3.000091 1.124747 2.667 0.026 .4557369 - 5.544445 -------------------------------------------------------------------- - LÖnh: reg y2 x2 Source | SS df MS Number of obs = 11 ---------+------------------------------ F( 1, 9) = 17.97 Model | 27.5000024 1 27.5000024 Prob > F = 0.0022 Residual | 13.776294 9 1.53069933 R-squared = 0.6662 ---------+------------------------------ Adj R-squared = 0.6292 Total | 41.2762964 10 4.12762964 Root MSE = 1.2372 -------------------------------------------------------------------- y2 | Coef. Std. Err. t P>|t| [95% Conf. Interval] ---------+---------------------------------------------------------- x2 | .5 .1179638 4.239 0.002 .2331475 - .7668526 _cons | 3.000909 1.125303 2.667 0.026 .4552978 - 5.54652 --------------------------------------------------------------------
- LÖnh: reg y3 x3 Source | SS df MS Number of obs = 11 ---------+------------------------------ F( 1, 9) = 17.97 Model | 27.4700075 1 27.4700075 Prob > F = 0.0022 Residual | 13.7561905 9 1.52846561 R-squared = 0.6663 ---------+------------------------------ Adj R-squared = 0.6292 Total | 41.2261979 10 4.12261979 Root MSE = 1.2363 -------------------------------------------------------------------- y3 | Coef. Std. Err. t P>|t| [95% Conf. Interval] ---------+---------------------------------------------------------- x3 | .4997273 .1178777 4.239 0.002 .2330695 - .7663851 _cons | 3.002455 1.124481 2.670 0.026 .4587014 - 5.546208 -------------------------------------------------------------------- - LÖnh: reg y4 x4 Source | SS df MS Number of obs = 11 ---------+------------------------------ F( 1, 9) = 18.00 Model | 27.4900007 1 27.4900007 Prob > F = 0.0022 Residual | 13.7424908 9 1.52694342 R-squared = 0.6667 ---------+------------------------------ Adj R-squared = 0.6297 Total | 41.2324915 10 4.12324915 Root MSE = 1.2357 -------------------------------------------------------------------- y4 | Coef. Std. Err. t P>|t| [95% Conf. Interval] ---------+---------------------------------------------------------- x4 | .4999091 .1178189 4.243 0.002 .2333841 - .7664341 _cons | 3.001727 1.123921 2.671 0.026 .4592411 - 5.544213
12/20/13
21
LÖnh reg Y1 X1 LÖnh reg Y2 X2
LÖnh reg Y3 X3 LÖnh reg Y4 X4
12/20/13
22
Ph©n biÖt sai sè ngÉu nhiªn vµ sai sè hÖ thèng
ooooooooooooooooo
oo oooo
oooooooooo oooooooooooooooooooooooo
oooooooooo oooo oo
Sai sè"hÖ thèng"
May rñi"
80 " 90 "mmHg"
A (®óng)"
"B (sai)"
"
Sai sè ngÉu nhiªn vµ sai sè hÖ thèng
** ******
** ******
* * * * *
* * * * * * *
* *
* * * * *
* * * * * * *
* *
Kh¸i niÖm vÒ nhiÔu
Møc ®é lÖ thuéc insulin T!nh tr"ng sèng sãt Kh«ng Cã Sèng 326 253 ChÕt 218 105 Tæng 544 358 Tû lÖ chÕt 40% 29%
Møc ®é lÖ thuéc insulin T!nh tr"ng sèng sãt Kh«ng Cã Sèng 15 129 ChÕt 0 1 Tæng 15 130 Tû lÖ chÕt 0% 1%
Møc ®é lÖ thuéc insulin T!nh tr"ng sèng sãt Kh«ng Cã Sèng 311 124 ChÕt 218 104 Tæng 529 228 Tû lÖ chÕt 41% 46%
TÇng 1: Tuæi bÖnh nh©n ≤ 40 " TÇng 2: Tuæi bÖnh nh©n > 40 "
Kh¸i niÖm vÒ nhiÔu vµ t¸c ®éng t¬ng hç
Lo¹i nghiªn cøu !Gi¸ trÞ chung vµ theo tÇng !
NhËn xÐt!TÇng 1 ! TÇng 2 !
Chung 2 tÇng (crude) !
1 2 3
ThuÇn tËp (RR) ThuÇn tËp (RR) BÖnh chøng (OR)
1,02 1,74 0,96
1,86 3,00 0,45
4,00 1,00 1,83
NhiÔu vµ cã t¸c ®éng t¬ng hç gi÷a c¸c tÇng
4 5 6
ThuÇn tËp (RR) ThuÇn tËp (RR) BÖnh chøng (OR)
4,00 1,00 1,83
4,00 1,00 1,83
4,00 1,00 1,83
Kh«ng nhiÔu vµ kh«ng cã t¸c ®éng t¬ng hç
7 8 9
ThuÇn tËp (RR) ThuÇn tËp (RR) BÖnh chøng (OR)
1,01 3,00 0,83
1,01 3,00 0,83
4,00 1,00 1,83
NhiÔu vµ kh«ng cã t¸c ®éng t¬ng hç
10 11 12
ThuÇn tËp (RR) ThuÇn tËp (RR) BÖnh chøng (OR)
1,07 3,00 0,36
9,40 0,33 6,00
4,00 1,00 1,83
T¸c ®éng t¬ng hç rÊt lín àlµm lu mê nhiÔu
12/20/13
23
Ph¬i nhiÔm BÖnh Tæng
Cã Kh«ng
Cã 200 800 1000
Kh«ng 50 950 1000
Tæng 250 1,750 2,000
TÇng 1: Cã yÕu tè nhiÔu
Ph¬i nhiÔm
BÖnh Tæng
Cã Kh«ng
Cã 194 706 900
Kh«ng 21 79 100
Tæng 215 785 1000
TÇng 2: Kh«ng cã YT nhiÔu
Ph¬i nhiÔm
BÖnh Tæng
Cã Kh«ng
Cã 6 94 100
Kh«ng 29 871 900
Tæng 35 965 1000
00.41000/501000/200
==cRR
02.1100/21900/194
1 ==RR 86.1900/29100/6
2 ==RR
RR hiÖu chØnh = 1.14 !
VÝ dô vÒ viÖc ph©n tÝch tÇng khö nhiÔu Ph¬ng ph¸p khö nhiÔu tèi u
v Håi quy ®a biÕn:
Y = a + b1X1 + b2X2 + b3X3 +...... + biXi
v Håi quy logistics
)...( 33221111
ii xbxbxbxbaeY +++++!+=
Mét sè test thèng kª thêng dïng kh¸c
Công thức Kappa
Người đánh giá 1 + - ∑
Người đánh giá 2
+ a b p1
- c d q1
∑ p2 q2 1 1221
)(2qpqpbcadK
+
!=
Giá trị của Kappa (K) Cách giải thích > 0,75 Rất đồng ý
0,40 - 0,75 Đồng ý (vừa phải) < 0,40 Không đồng ý
12/20/13
24
Ví dụ (bảng tần số)
Kỹ thuật viên XQ 1
+ - Tổng số film đọc
Kỹ thuật viên XQ 2
+ 1.467 1.309 2.776
- 782 16.232 17.014
Tổng số film đọc 2.249 17.541 19.790
Chuyển sang bảng tỷ lệ
Kỹ thuật viên XQ 1
+ - Tỷ lệ film đọc
Kỹ thuật viên XQ 2
+ 0,0741 0,0662 0,1403
- 0,0395 0,8202 0,8597
Tỷ lệ film đọc 0,1136 0,8864 1
Cách tính giá trị Kappa
Kỹ thuật viên XQ 1 + - Tỷ lệ film đọc
KTV XQ 2
+ 0,0741 (a) 0,0662 (b) 0,1403 (p1)
- 0,0395 (c) 0,8202 (d) 0,8597 (q1)
Tỷ lệ film đọc 0,1136 (p2) 0,8864 (q2) 1
5240,0)8597,0)(1136,0()8864,0)(1403,0()]0395,0)(0661,0()8202,0)(0741,0[(2=
+!
=K
1221
)(2qpqpbcadK
+
!=
Tổng quát: Bảng tần số
Chuyên gia 1
+ - Tổng số
Chuyên gia 2
+ a b (a + b)
- c d (c + d)
Tổng số (a + c) (b + d) n
12/20/13
25
Tổng quát: Bảng tỷ lệ
Chuyên gia 1
+ - Tỷ lệ
Chuyên gia 2
+ a/n b/n (a + b)/n
- c/n d/n (c + d)/n
Tỷ lệ (a + c)/n (b + d)/n n/n