25
12/20/13 1 Bài 7: PHÂN TÍCH SLIU PGS.TS. Lưu Ngc Hot Vin YHDP và Y tế công cng, ĐH Y Hà Ni Câu hi 1. Vi bsliu dưới đây thì nên tính Trung bình hay Trung v? Ti sao? 12, 10, 14, 11, 16, 12, 13, 25, 80 2. Khi nào thì phi ngoi suy sliu? 3. Khi nào thì áp dng ước lượng, khi nào thì kim định githuyết? 4. Khi nào cn áp dng test ghép cp? Cho ví dvloi nghiên cu cn áp dng test ghép cp? 5. Ti sao phi sdng test phi tham s? Điu kin nào để có tháp dng được các test tham s? 6. Điu kin để áp dng test Khi Bình phương? Dùng test gì khi test Khi Bình phương không thích hp? QuÇn thÓ ®Ých QuÇn thÓ nghiªn cøu MÉu Tham sè quÇn thÓ (μ, σ, P...) MÉu x¸c suÊt - NgÉu nhiªn ®¬n - NgÉu nhiªn hÖ thèng - MÉu ph©n tÇng - MÉu chïm - MÉu nhiÒu bËc MÉu kh«ng x¸c suÊt - MÉu kinh nghiÖm - MÉu thuËn tiÖn - MÉu chØ tiªu - MÉu cã môc ®Ých. Chän mÉu ¦íc l-îng ®iÓm kho¶ng KiÓm ®Þnh gi¶ thuyÕt Suy luËn th«ng kª (ChØ ¸p dông cho mÉu x¸c suÊt víi cì mÉu ®ñ lín) KÕt luËn ngo¹i suy C¸c test thèng kª Gi¸ trÞ p Lùa chän M« t¶ c¸c tham sè mÉu (tr×nh bμy kÕt qu¶ nghiªn c-ó) Tham sè mÉu ( , s, p...) X BiÕn sè Thèng kª m« t¶ Thèng kª suy luËn Ph©n biÖt thèng kª m« t¶ vμ thèng kª suy luËn Thèng kª m« t¶: lμ m« t¶ kÕt qu¶ thu ®-îc tõ mÉu nghiªn cøu biÓu thÞ ®é lín, sù ph©n bè cña c¸c tham sè cña mÉu nghiªn cøu nh- , ®é lÖch chuÈn, c¸c tû lÖ, b¶ng, biÓu, ®å thÞ sù ph©n bè theo c¸c biÕn sè kh¸c nhau nh- tuæi, giíi, ®Þa d-... Thèng kª suy luËn: lμ qu¸ tr×nh ngo¹i suy kÕt qu¶ nghiªn cøu tõ mÉu ra quÇn thÓ nghiªn cøu. bao gåm 2 ph-¬ng ph¸p: -íc l-îng vμ kiÓm ®Þnh X

Bài 7: PHÂN TÍCH SỐ LIỆUhpec.hmu.edu.vn/images/2013/12/Bai 7_ Phan tich so lieu... · 2013-12-22 · 12/20/13 1 Bài 7: PHÂN TÍCH SỐ LIỆU PGS.TS. Lưu Ngọc Hoạt Viện

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Bài 7: PHÂN TÍCH SỐ LIỆUhpec.hmu.edu.vn/images/2013/12/Bai 7_ Phan tich so lieu... · 2013-12-22 · 12/20/13 1 Bài 7: PHÂN TÍCH SỐ LIỆU PGS.TS. Lưu Ngọc Hoạt Viện

12/20/13

1

Bài 7:

PHÂN TÍCH SỐ LIỆU

PGS.TS. Lưu Ngọc Hoạt

Viện YHDP và Y tế công cộng, ĐH Y Hà Nội

Câu hỏi 1.  Với bộ số liệu dưới đây thì nên tính Trung bình hay

Trung vị? Tại sao? 12, 10, 14, 11, 16, 12, 13, 25, 80

2.  Khi nào thì phải ngoại suy số liệu? 3.  Khi nào thì áp dụng ước lượng, khi nào thì kiểm định

giả thuyết? 4.  Khi nào cần áp dụng test ghép cặp? Cho ví dụ về loại

nghiên cứu cần áp dụng test ghép cặp? 5.  Tại sao phải sử dụng test phi tham số? Điều kiện nào để có thể áp dụng được các test tham số?

6.  Điều kiện để áp dụng test Khi Bình phương? Dùng test gì khi test Khi Bình phương không thích hợp?

QuÇn thÓ ®Ých"

QuÇn thÓ nghiªn cøu"

MÉu"

Tham sè quÇn thÓ "(µ, σ, P...)"MÉu x¸c suÊt"

- NgÉu nhiªn ®¬n !- NgÉu nhiªn hÖ thèng!- MÉu ph©n tÇng !- MÉu chïm !- MÉu nhiÒu bËc !

MÉu kh«ng x¸c suÊt"- MÉu kinh nghiÖm "- MÉu thuËn tiÖn !- MÉu chØ tiªu!- MÉu cã môc ®Ých."

Chän mÉu "

¦íc l­îng "•  ®iÓm"•  kho¶ng "

KiÓm ®Þnh gi¶ thuyÕt"

Suy luËn th«ng kª (ChØ ¸p dông cho mÉu x¸c suÊt víi cì mÉu ®ñ lín) "

KÕt luËn ngo¹i suy !

C¸c test thèng kª

Gi¸ trÞ p

Lùa chän!

M« t¶ c¸c tham sè mÉu"(tr×nh bµy kÕt qu¶ nghiªn c­ó) "

Tham sè mÉu"( , s, p...)!XBiÕn sè !

Thèng kª m« t¶ "

Thèng kª suy luËn" Ph©n biÖt thèng kª m« t¶ vµ thèng kª suy luËn

v  Thèng kª m« t¶: ‒  lµ m« t¶ kÕt qu¶ thu ®­îc tõ mÉu nghiªn cøu ‒  biÓu thÞ ®é lín, sù ph©n bè cña c¸c tham sè cña

mÉu nghiªn cøu nh­ , ®é lÖch chuÈn, c¸c tû lÖ, b¶ng, biÓu, ®å thÞ sù ph©n bè theo c¸c biÕn sè kh¸c nhau nh­ tuæi, giíi, ®Þa d­...

v  Thèng kª suy luËn: ‒  lµ qu¸ tr×nh ngo¹i suy kÕt qu¶ nghiªn cøu tõ mÉu

ra quÇn thÓ nghiªn cøu. ‒  bao gåm 2 ph­¬ng ph¸p: ­íc l­îng vµ kiÓm ®Þnh

X

Page 2: Bài 7: PHÂN TÍCH SỐ LIỆUhpec.hmu.edu.vn/images/2013/12/Bai 7_ Phan tich so lieu... · 2013-12-22 · 12/20/13 1 Bài 7: PHÂN TÍCH SỐ LIỆU PGS.TS. Lưu Ngọc Hoạt Viện

12/20/13

2

1. Thèng kª m« t¶

Bµi tËp

Nếu một người nghiên cứu muốn thu thập số liệu về huyết áp tối đa của các đối tượng NC, cách thu thập nào dưới đây Anh/Chị cho là hợp lý nhất?

A. Phân huyết áp thành các nhóm (ví dụ < 90 mmHg; 90-120; 121-140...) sau đó chọn nhóm thích hợp

B. Ghi đầy đủ trị số huyết áp tối đa của từng đối tượng.

C. Phân đối tượng thành hai loại có và không cao huyết áp tối đa

D. Phân thành các nhóm: huyết áp thấp, bình thường, cao và rất cao

Bµi tËp

Nếu một người nghiên cứu muốn thu thập số liệu về số điếu thuốc lá một người hút trung bình/ngày, cách thu thập nào dưới đây Anh/Chị cho là hợp lý nhất?

A.  Phân thành các nhóm (ví dụ < 5 điếu; 5-10; 11-15; 16-20...) sau đó chọn nhóm thích hợp

B.  Ghi chính xác số điếu thuốc hút trung bình mà đối tượng đã trả lời.

C.  Phân đối tượng thành hai loại: hút trên 1 bao hoặc dưới một bao

D.  Phân thành các nhóm: hút nhẹ, hút trung bình, hút nhiều, hút rất nhiều.

¦u ®iÓm cña ph©n tÝch sè liÖu d­íi d¹ng ®Þnh l­îng (vÝ dô c©n nÆng khi ®Î cña trÎ)

BA XX >>PA = PB = 10% "

2500 gr "

50 trÎ 450 trÎ

B

2500 gr "

50 trÎ 450 trÎ

A 2500 gr "

50 trÎ 450 trÎ

A

Page 3: Bài 7: PHÂN TÍCH SỐ LIỆUhpec.hmu.edu.vn/images/2013/12/Bai 7_ Phan tich so lieu... · 2013-12-22 · 12/20/13 1 Bài 7: PHÂN TÍCH SỐ LIỆU PGS.TS. Lưu Ngọc Hoạt Viện

12/20/13

3

¦u ®iÓm cña ph©n tÝch sè liÖu d­íi d¹ng ®Þnh l­îng (tiÕp) (Huyết ¸p tối đa)

PA = PB = 60% "

140 mmHg "

300 người 200 người

A

140 mmHg "

300 người 200 người

B

BA XX !

sB >> sA "

C¸c néi dung chÝnh cña thèng kª m« t¶

I. Tæng hîp c¸c biÕn sè"‒  Víi c¸c biÕn ®Þnh tÝnh:!

²  TÇn sè (frequency)!

²  Tû sè (ratio)!

²  Tû lÖ (proportion)!

²  Tû suÊt (rate)!

‒  Víi c¸c biÕn ®Þnh l­îng: !

²  §o l­êng ®é tËp trung: gi¸ trÞ trung b×nh, trung vÞ, mèt!

²  §o l­êng ®é ph©n t¸n: ph­¬ng sai, ®é lÖch chuÈn, "

C¸c néi dung chÝnh cña thèng kª m« t¶

II. Tr×nh bµy sè liÖu b»ng b¶ng: "‒  B¶ng 1 chiÒu "‒  B¶ng 2 chiÒu"

III. Tr×nh bµy sè liÖu b»ng biÓu vµ ®å thÞ "‒  §å thÞ cét: "

²  Cét rêi, !²  Cét chång, !²  Cét liªn tôc !

‒  §å thÞ h×nh trßn"‒  BiÓu ®å gÊp khóc "‒  BiÓu ®å ®a gi¸c "‒  BiÓu ®å chÊm (®¸m m©y)"‒  B¶n ®å "

1/ Tæng hîp sè liÖu víi c¸c biÕn ®Þnh tÝnh

Page 4: Bài 7: PHÂN TÍCH SỐ LIỆUhpec.hmu.edu.vn/images/2013/12/Bai 7_ Phan tich so lieu... · 2013-12-22 · 12/20/13 1 Bài 7: PHÂN TÍCH SỐ LIỆU PGS.TS. Lưu Ngọc Hoạt Viện

12/20/13

4

1.1. TÇn sè (frequency):

v  BiÓu thÞ sè lÇn xuÊt hiÖn cña 1 quan s¸t nµo ®ã"v  VD : Ph©n bè nhãm d©n téc trong sè 22 ng­êi

nghiªn cøu.

22 "Tæng céng"

6"Nïng "

12 "Tµy"

4"Kinh "

TÇn sè"§Õm sè lÇn xuÊt hiÖn"Gi¸ trÞ biÕn "

1.2. Tû sè (ratio):

v  Lµ ph©n sè mµ mÉu sè kh«ng bao hµm tö sè

n  Tö sè vµ mÉu sè cã thÓ kh¸c nhau vÒ ®¬n vÞ ®o l­êng

n  HÖ sè k cã thÓ lµ 1, 10, 100, 1000... n  VÝ dô:

a"--- x k " b"

sè häc sinh nam ----------------------sè häc sinh n÷

sè gi­êng bÖnh ----------------------------d©n sè trong khu vùc

1.3. Tû lÖ (proportion):

:  Lµ 1 ph©n sè mµ mÉu sè bao hµm tö sè, do vËy c¶ mÉu vµ tö ®Òu ph¶i cïng ®¬n vÞ

a"------- x k "a + b"

n  HÖ sè k cã thÓ lµ 1, 10, 100, 1000... n  Khi k = 100, ta cã tû lÖ phÇn tr¨m (percentage)!

n  VÝ dô:" sè häc sinh nam Tû lÖ häc sinh nam = ----------------------- tæng sè häc sinh

sè ng­êi m¾c sèt rÐt Tû lÖ m¾c sèt rÐt = ---------------------------------- tæng sè ng­êi ®­îc kh¸m

1.4. Tû suÊt (rate):

v  Lµ 1 d¹ng ®Æc biÖt cña tû lÖ khi nã ®­îc ®o l­êng trong mét kho¶ng thêi gian nhÊt ®Þnh

v  VÝ dô:

sè biÕn cè xÈy ra trong 1 kho¶ng thêi gian ------------------------------------------------------------ x k d©n sè trung b×nh trong kho¶ng thêi gian ®ã

n  HÖ sè k cã thÓ lµ 1, 10, 100, 1000... n  VÝ dô:"

sè ng­êi bÞ sèt rÐt t¹i huyÖn A n¨m 2000 ------------------------------------------------------------- x 100 d©n sè trung b×nh cña huyÖn A trong n¨m ®ã

Page 5: Bài 7: PHÂN TÍCH SỐ LIỆUhpec.hmu.edu.vn/images/2013/12/Bai 7_ Phan tich so lieu... · 2013-12-22 · 12/20/13 1 Bài 7: PHÂN TÍCH SỐ LIỆU PGS.TS. Lưu Ngọc Hoạt Viện

12/20/13

5

2/ Tæng hîp sè liÖu víi c¸c biÕn ®Þnh l­îng

2.1. §o l­êng ®é tËp trung:

Bµi tËp

Tham số nào là thích hợp nhất để đo lường độ tập trung của bộ số liệu dưới đây: 12, 15, 17, 20, 23, 24, 26, 28, 80

A.  Trung vị B.  Khoảng phần trăm C.  Giá trị trung bình D.  Độ lệch chuẩn

v  §­îc tÝnh b»ng tæng sè c¸c gi¸ trÞ quan s¸t ®­îc chia cho sè lÇn quan s¸t.

v  Gi¸ trÞ trung b×nh chØ tÝnh ®­îc víi c¸c sè d¹ng liÖu sè (biÕn ®Þnh l­îng)

v  VÝ dô:!

‒  ChiÒu cao cña 7 em g¸i ®o ®­îc nh­ sau:

‒  141, 141, 143, 144, 145, 146, 155 cm (tæng céng tÊt c¶ chiÒu cao lµ 1015 cm)

‒  V× vËy trung b×nh b»ng 1015/7, tøc lµ 145 cm.

n

X

nXXXX

n

ii

n!==

+++= 121 ...

v  Trung b×nh sè häc (trung b×nh céng):

v  Lµ gi¸ trÞ gi÷a cña 1 bé sè liÖu khi chóng ®­îc s¾p xÕp theo thø tù t¨ng dÇn hoÆc gi¶m dÇn.

v  Gi¸ trÞ nµy chia sù ph©n bè cña sè liÖu thµnh hai phÇn b»ng nhau

!

v  VÝ dô:!‒  ta cã bé sè liÖu: 47, 41, 44, 43, 42, 40, 72 kg.

‒  ®Ó tÝnh trung vÞ, tr­íc hÕt s¾p xÕp sè liÖu theo thø tù: 40, 41, 42, 43, 44, 47, 72 kg.

‒  trung vÞ sÏ lµ gi¸ trÞ cña quan s¸t thø (n+1)/2, tøc lµ (7+1)/2 =4, vµ gi¸ trÞ thø 4 = 43 kg lµ trung vÞ.

‒  Víi bé sè liÖu: 40, 41, 42, 43, 44, 47, 49 vµ 72 th× trung vÞ lµ gi¸ trÞ trung b×nh céng cña gi¸ trÞ thø 4 vµ thø 5 = (43+44)/2 = 43,5

v  Trung vÞ (gi¸ trÞ trung t©m):

Page 6: Bài 7: PHÂN TÍCH SỐ LIỆUhpec.hmu.edu.vn/images/2013/12/Bai 7_ Phan tich so lieu... · 2013-12-22 · 12/20/13 1 Bài 7: PHÂN TÍCH SỐ LIỆU PGS.TS. Lưu Ngọc Hoạt Viện

12/20/13

6

v  Lµ gi¸ trÞ quan s¸t ®­îc nhiÒu lÇn nhÊt trong bé sè liÖu v  Trong bé sè liÖu d­íi ®©y:141, 141, 143, 144, 145, 146,

155 th× 141 ®­îc coi lµ mèt v× quan s¸t ®­îc nhiÒu lÇn nhÊt.

v  Mèt Ýt cã gi¸ trÞ trong ®o l­êng ®é tËp trung cña bé sè liÖu khi ë d¹ng ®Þnh l­îng, nh­ng cã gi¸ trÞ víi bé sè liÖu ph©n nhãm, hoÆc biÕn ®Þnh tÝnh

v  VÝ dô: Trong b¶ng d­íi, nhãm tuæi 36-45 lµ mèt

Nhãm tuæi TÇn sè Nhãm tuæi TÇn sè Nhãm tuæi TÇn sè

< 5 15 26-35 67 56-65 43

5-15 24 36-45 120 66-75 27

16-25 32 46-55 94 >75 12

v  Mèt: Ph©n biÖt vÒ gi¸ trÞ trung b×nh, trung vÞ vµ mèt:

Mèt = 10 "Trung vÞ = 11 "Trung b×nh = 11,3 "

§o l­êng (cm)"

VÝ dô ph©n bè chuÈn

Freq

uenc

y

bwt 709 " 4990 "

0 "

29 "

Ph©n biÖt vÒ gi¸ trÞ trung b×nh, trung vÞ vµ mèt (tiÕp):

v  Gi¸ trÞ trung b×nh ®­îc sö dông th­êng xuyªn h¬n vµ cã gi¸ trÞ khi bé sè liÖu lµ 1 ph©n bè chuÈn."

v  Khi bé sè liÖu ph©n bè kh«ng chuÈn, trung vÞ cã ý nghÜa h¬n:"

v  VÝ dô: !

‒  Víi bé sè liÖu nµy: 40, 41, 42, 43, 44, 47, 72 th× gi¸ trÞ trung b×nh = 47, trong khi gi¸ trÞ trung vÞ b»ng 43.

‒  NÕu ta thay gi¸ trÞ 72 trong bé sè liÖu trªn = 51, gi¸ trÞ trung vÞ kh«ng ®æi, nh­ng gi¸ trÞ trung b×nh chØ cßn lµ 44!

Page 7: Bài 7: PHÂN TÍCH SỐ LIỆUhpec.hmu.edu.vn/images/2013/12/Bai 7_ Phan tich so lieu... · 2013-12-22 · 12/20/13 1 Bài 7: PHÂN TÍCH SỐ LIỆU PGS.TS. Lưu Ngọc Hoạt Viện

12/20/13

7

2/ Tæng hîp sè liÖu víi c¸c biÕn ®Þnh l­îng (tiÕp)

2.2. §o l­êng ®é ph©n t¸n:

v  Kho¶ng sè liÖu (range): "‒  Lµ hiÖu gi÷a hai gi¸ trÞ ®o l­êng cao nhÊt vµ thÊp nhÊt

trong mét bé sè liÖu. ‒  Kho¶ng sè liÖu (R) = Xmax ‒ Xmin

v  VÝ dô: nÕu c©n nÆng cña 7 phô n÷ lµ 40, 41, 42, 43, 44, 47 vµ 72 kg, kho¶ng quan s¸t sÏ lµ 72 - 40 = 32 kg."

1

)(1

2

2

!

!="=

n

XXis

n

i

v  Ph­¬ng sai (variance)"

‒  Lµ tæng b×nh ph­¬ng c¸c kho¶ng c¸ch gi÷a gi¸ trÞ quan s¸t so víi gi¸ trÞ trung b×nh chia cho sè c¸c quan s¸t trõ ®i 1.

v §é lÖch chuÈn (standard deviation)"

2ss =

v  VÝ dô minh ho¹:

X

v  VÝ dô minh ho¹ (tiÕp):

6

10

0

30

Σ

1 2 1 0 4 B×nh ph­¬ng kho¶ng chªnh lÖch gi÷a gi¸ trÞ quan s¸t so víi gi¸ trÞ trung b×nh

1 2 -1 0 -2 Kho¶ng chªnh lÖch so víi gi¸ trÞ trung b×nh

7 8 5 6 4 Tû lÖ phô n÷ lµm kinh tÕ giái (Xi)

01 00 99 98 97

)( XXi !

5,2410

1

)(1

2

2 ==!

!="=

n

XXis

n

i

X

2)( XXi !

58,15,2 ==! s

Page 8: Bài 7: PHÂN TÍCH SỐ LIỆUhpec.hmu.edu.vn/images/2013/12/Bai 7_ Phan tich so lieu... · 2013-12-22 · 12/20/13 1 Bài 7: PHÂN TÍCH SỐ LIỆU PGS.TS. Lưu Ngọc Hoạt Viện

12/20/13

8

v  HÖ sè biÕn thiªn (coeficient of variation)"v  Lµ tû sè gi÷a ®é lÖch chuÈn vµ trÞ tuyÖt ®èi cña gi¸ trÞ trung

b×nh

v  HÖ sè biÕn thiªn ®­îc biÓu thÞ b»ng tû lÖ phÇn tr¨m (%) vµ biÓu thÞ møc ®é biÕn thiªn cña ®é lÖch chuÈn so víi gi¸ trÞ trung b×nh

v  Gióp cho viÖc so s¸nh møc ®é ph©n t¸n cña nhiÒu bé sè liÖu víi nhau:

v  VÝ dô:!

v  CV cña c©n nÆng nam =12/60 = 20% v  CV cña c©n nÆng n÷ = 8/54 = 15% v  VËy bé sè liÖu cña c©n nÆng nam ph©n t¸n h¬n

XsCV =

8 54 C©n nÆng n÷ thanh niªn 12 60 C©n nÆng nam thanh niªn s X

v  Thèng kª m« t¶: Quan t©m ®Õn mÉu NC ‒  Tæng hîp sè liÖu:

²  tû lÖ, tû sè, tû suÊt ²  §é tËp trung, ®é ph©n t¸n cña bé sè liÖu ®Þnh l­îng

‒  Tr×nh bµy kÕt qu¶ nghiªn cøu: ²  B¶ng ²  BiÓu ®å, ®å thÞ

v  Thèng kª suy luËn: quan t©m ®Õn quÇn thÓ ‒  ¦íc l­îng :

²  §iÓm, ²  Kho¶ng

‒  KiÓm ®Þnh gi¶ thuyÕt ²  Kh¸c nhau ²  T­¬ng quan

2. Thèng kª suy luËn

2.1. ¦íc l­îng ®iÓm, kho¶ng"

Ph©n biÖt ­íc l­îng vµ kiÓm ®Þnh

v  ­íc l­îng: ‒  ngo¹i suy tõ tham sè mÉu ra tham sè quÇn thÓ:

‒  tõ trung b×nh cña mÉu ( ) sang TB quÇn thÓ (µ)

‒  tõ tû lÖ cña mÉu (p) sang tû lÖ cña quÇn thÓ (P) ‒  tõ OR, RR, r cña mÉu ra quÇn thÓ.

v  KiÓm ®Þnh gi¶ thuyÕt: ‒  so s¸nh 2 hoÆc nhiÒu quÇn thÓ NC tõ sù kh¸c biÖt

cña 2 hoÆc nhiÒu mÉu rót ra tõ c¸c quÇn thÓ ®ã. ‒  kiÓm ®Þnh mèi t­¬ng quan cña quÇn thÓ dùa theo

mèi t­¬ng quan thu ®­îc tõ mÉu

X

Page 9: Bài 7: PHÂN TÍCH SỐ LIỆUhpec.hmu.edu.vn/images/2013/12/Bai 7_ Phan tich so lieu... · 2013-12-22 · 12/20/13 1 Bài 7: PHÂN TÍCH SỐ LIỆU PGS.TS. Lưu Ngọc Hoạt Viện

12/20/13

9

VÝ dô: C©n nÆng khi ®Î cña trÎ míi sinh t¹i huyÖn A: tham sè mÉu vµ quÇn thÓ

TrÎ s¬ sinh" t¹i huyÖn A"

5000 trÎ "

MÉu"500 trÎ "

12802954±=± sXTham sè mÉu:

??±=±!µTham sè QT:

­íc l­îng hay kiÓm ®Þnh?

VÝ dô: C©n nÆng khi ®Î cña trÎ míi sinh t¹i huyÖn A: tham sè mÉu vµ quÇn thÓ

TrÎ s¬ sinh" t¹i huyÖn A "

5000 trÎ "

MÉu"500 trÎ "

Tû lÖ trÎ (p) cã c©n nÆng < 2500 gram = 20%

­íc l­îng hay kiÓm ®Þnh?

Tû lÖ trÎ (P) cã c©n nÆng < 2500 gram = ?

VÝ dô: C©n nÆng khi ®Î cña trÎ míi sinh t¹i huyÖn A vµ huyÖn B

TrÎ s¬ sinh" t¹i huyÖn A"

5000 trÎ "

TrÎ s¬ sinh" t¹i huyÖn B "

6000 trÎ "

MÉu"500 trÎ "

MÉu B "500 trÎ "

?

12802954± 8862785±>­íc l­îng hay kiÓm ®Þnh?

* ¦íc l­îng ®iÓm:"X=µ

P = p !+ Víi biÕn ®Þnh l­îng: è

+ Víi biÕn ®Þnh tÝnh: è

n  Nh­îc ®iÓm cña ­íc l­îng ®iÓm:

n  VÝ dô ®iÓm thi cña 9 sinh viªn

Sinh viªn sè 1 2 3 4 5 6 7 8 9

§iÓm ®¹t ®­îc 9 8 7 9 6 4 5 8 3

NÕu coi 9 sinh viªn nµy lµ 1 quÇn thÓ è

56,69

385469789=

++++++++=µ

NÕu chän ngÉu nhiªn1 mÉu cã 2 SV, ta sÏ cã 36 c¬ héi.

N!"---------"

n!(N-n)!"

Page 10: Bài 7: PHÂN TÍCH SỐ LIỆUhpec.hmu.edu.vn/images/2013/12/Bai 7_ Phan tich so lieu... · 2013-12-22 · 12/20/13 1 Bài 7: PHÂN TÍCH SỐ LIỆU PGS.TS. Lưu Ngọc Hoạt Viện

12/20/13

10

* ¦íc l­îng ®iÓm (tiÕp) MÉu sè:

CÆp sinh viªn sè:

§iÓm cña tõng sinh viªn

§iÓm trung b×nh cña 2 sinh viªn

1

1, 2

9

8

8,5

2

1, 3

9

7

8,0

3

1, 4

9

9

9,0

4

1, 5

9

6

7,5

5

1, 6

9

4

6,5

6

1, 7

9

5

7,0

7

1, 8

9

8

8,5

8

1, 9

9

3

6,0

9

2, 3

8

7

7,5

10

2, 4

8

9

8,5

11

2, 5

8

6

7,0

12

2, 6

8

4

6,0

36

8,9

8

3

5,5

* ¦íc l­îng ®iÓm (tiÕp)

1 1

2 2

4

5 5

4 4

3

4

10

1

2

3

4

5

3.5 4 4.5 5 5.5 6 6.5 7 7.5 8 8.5 9

TÇn sè quan s¸t víi c¸c trung b×nh mÉu kh¸c nhau (ph©n bè mÉu):

TB mÉu 3,5 4,0 4,5 5,0 5,5 6,0 6,5 7,0 7,5 8,0 8,5 9,0

TÇn sè 1 1 2 2 4 5 5 4 4 3 4 1

VÝ dô ph©n bè chuÈn

Freq

uenc

y

bwt 709 " 4990 "

0 "

29 "

* ¦íc l­îng kho¶ng

+ Víi biÕn ®Þnh l­îng: è

+ Víi biÕn ®Þnh tÝnh: è

+ C«ng thøc tæng qu¸t:

Tham sè quÇn thÓ = tham sè mÉu ±Zα/2.SE

SE (Sai sè chuÈn) = ®é lÖch chuÈn cña c¸c trung b×nh mÉu

¦íc l­îng kho¶ng cßn dïng víi nhiÒu tham sè mÉu kh¸c nh­ OR, RR, r...

nsZX 2/!µ ±=

nppZpP )1.(

2/!

±= "

Page 11: Bài 7: PHÂN TÍCH SỐ LIỆUhpec.hmu.edu.vn/images/2013/12/Bai 7_ Phan tich so lieu... · 2013-12-22 · 12/20/13 1 Bài 7: PHÂN TÍCH SỐ LIỆU PGS.TS. Lưu Ngọc Hoạt Viện

12/20/13

11

* Nguyªn lý ­íc l­îng kho¶ng vµ kho¶ng tin cËy

µ

2.2. KiÓm ®Þnh gi¶ thuyÕt"

* So s¸nh sù kh¸c nhau gi÷a 2 nhãm "

VÝ dô 2: So s¸nh c©n nÆng khi ®Î cña trÎ míi sinh t¹i huyÖn A so víi huyÖn B:

TrÎ s¬ sinh" t¹i huyÖn A "

5000 trÎ "

TrÎ s¬ sinh" t¹i huyÖn B "

6000 trÎ "

MÉu A "500 trÎ "

MÉu B "500 trÎ "

1. Khi c©n nÆng cña trÎ d­íi d¹ng gram"

TrÎ s¬ sinh" t¹i huyÖn A "

5000 trÎ "

TrÎ s¬ sinh" t¹i huyÖn B "

5000 trÎ "

MÉu A "500 trÎ "

MÉu B "500 trÎ "

?

Test t!

12802954± 8862785±>

Page 12: Bài 7: PHÂN TÍCH SỐ LIỆUhpec.hmu.edu.vn/images/2013/12/Bai 7_ Phan tich so lieu... · 2013-12-22 · 12/20/13 1 Bài 7: PHÂN TÍCH SỐ LIỆU PGS.TS. Lưu Ngọc Hoạt Viện

12/20/13

12

2. Khi c©n nÆng cña trÎ d­íi d¹ng < hoÆc ≥ 2500 gram"

TrÎ s¬ sinh" t¹i huyÖn A "

5000 trÎ "

TrÎ s¬ sinh" t¹i huyÖn B "

5000 trÎ "

MÉu A "500 trÎ "

MÉu B "500 trÎ "

>"

?

Test χ2 hoÆc Fisher test!

pA = 25% pB = 22%

2.2. KiÓm ®Þnh gi¶ thuyÕt"

* So s¸nh sù kh¸c nhau gi÷a > 2 nhãm "

TrÎ s¬ sinh" t¹i huyÖn A "

5000 trÎ "

TrÎ s¬ sinh" t¹i huyÖn B "

5000 trÎ "

MÉu A "500 trÎ "

MÉu B "500 trÎ "

12802954± 10242645±>

1. Víi biÕn ®Þnh l­îng"

TrÎ s¬ sinh" t¹i huyÖn C "

5000 trÎ "

MÉu C "500 trÎ "

8862785±<

? ?

Test ANOVA "

TrÎ s¬ sinh" t¹i huyÖn A "

5000 trÎ "

TrÎ s¬ sinh" t¹i huyÖn B "

5000 trÎ "

MÉu A "500 trÎ "

MÉu B "500 trÎ "

>

2. Víi biÕn ®Þnh tÝnh"

TrÎ s¬ sinh" t¹i huyÖn C "

5000 trÎ "

MÉu C "500 trÎ "

>

? ?

Test χ2 "

pA = 25% pB = 21% pc = 16%

Page 13: Bài 7: PHÂN TÍCH SỐ LIỆUhpec.hmu.edu.vn/images/2013/12/Bai 7_ Phan tich so lieu... · 2013-12-22 · 12/20/13 1 Bài 7: PHÂN TÍCH SỐ LIỆU PGS.TS. Lưu Ngọc Hoạt Viện

12/20/13

13

Kh«ng "ghÐp cÆp "

t test !cho cÆp"

test t-student hoÆc Z test "

Khi so s¸nh trªn 2 nhãm "

ANOVA "(F test) "

Ph©n tÝch sù"kh¸c nhau

BiÕn ®Þnh tÝnh"

BiÕn ®Þnh l­îng"

GhÐp cÆp "

Kh«ng "ghÐp cÆp "Víi tÊt c¶

c¸c lo¹i nghiªn cøu"

McNemar’s test (χ2) "

χ2 hoÆc Fisher test "

Khi so s¸nh " 2 nhãm"

GhÐp cÆp "

Kh«ng "ghÐp cÆp "

GhÐp cÆp " t test !cho cÆp"

Tæng hîp ph©n tÝch sù kh¸c nhau

2.2. KiÓm ®Þnh gi¶ thuyÕt"

KiÓm ®Þnh mèi t­¬ng quan gi÷a 2 biÕn nhÞ ph©n "

KiÓm ®Þnh mèi quan hÖ nh©n qu¶

Ph©n tÝch Sù "T­¬ng quan"

§o l­êng ®é lín cña mèi tư¬ng quan "

BiÕn nhÞ ph©n"

BiÕn ®Þnh l­îng"

NC ngang/ "NC bÖnh-chøng"

Tû suÊt chªnh (OR)"

NC thuÇn tËp/"NC Thö nghiÖm "

Nguy c¬ tư¬ng ®èi (RR) vµ OR!

Víi tÊt c¶ c¸c lo¹i nghiªn cøu"

Ph©n tÝch tư¬ng quan vµ håi quy "

Test ý nghÜa TK cña mèi tư¬ng quan "

BiÕn nhÞ ph©n"

Víi tÊt c¶ c¸c lo¹i nghiªn cøu"

χ2 hoÆc χ2 cña

McNemar’s "

Ph©n tÝch tư¬ng quan vµ håi quy "

"

Víi tÊt c¶ c¸c lo¹i nghiªn cøu"

"

BiÕn ®Þnh l­îng"

M«Ý liªn quan gi÷a tuæi vµ huyÕt ¸p tèi ®a "

sbp

age 17 70 110

220 - HÖ sè t­¬ng quan r

- Ph­¬ng tr×nh håi quy tuyÕn tÝnh

Page 14: Bài 7: PHÂN TÍCH SỐ LIỆUhpec.hmu.edu.vn/images/2013/12/Bai 7_ Phan tich so lieu... · 2013-12-22 · 12/20/13 1 Bài 7: PHÂN TÍCH SỐ LIỆU PGS.TS. Lưu Ngọc Hoạt Viện

12/20/13

14

B¶ng lùa chän test thèng kª BiÕn ®éc

lËp BiÕn Phô thuéc

1 biÕn ®Þnh tÝnh >2 biÕn ®Þnh tÝnh

1 ®Þnh lưîng

1 ®Þnh tÝnh, 1 ®Þnh

lưîng

NhiÒu biÕn ®Þnh tÝnh vµ/hoÆc

®Þnh l­îng

Cã 2 nhãm

Trªn 2 nhãm

1 biÕn ®Þnh lưîng

Test t Test ANOVA

Factorial design (thõa sè)

HÖ sè tư¬ng quan r hoÆc håi quy tuyÕn tÝnh

ANCOVA Ph©n tÝch håi quy ®a biÕn

1 biÕn nhÞ ph©n

OR, RR, χ2 hoÆc Fisher test

χ2 hoÆc Fisher test

Ph©n tÝch tÇng

Test t Factorial design (thõa sè)

Håi quy logistics

1 biÕn ®Þnh tÝnh

χ2 hoÆc Fisher test

χ2 hoÆc Fisher test

Ph©n tÝch tÇng

ANOVA Factorial design (thõa sè)

Mét sè test th­êng dïng

Ø  Test t student:

Ø  Test Khi b×nh ph­¬ng

Ø  Test ANOVA

Ø  Håi quy vµ hÖ sè t­¬ng quan

Ø  Test Khi b×nh ph­¬ng cña Mc. Nemar

Ø  Test t ghÐp cÆp

Ø  Mét sè test phi tham sè kh¸c nh­ test Mann-Whitney U test, Wilcoxon signed-rank test

)( 2!

Test t ghÐp cÆp

x1 x2 d = x1 ‒ x2

1,5 1,7 - 0,2

1,7 1,9 - 0.2

2,1 2,2 - 0,1

1,6 1,9 - 0,3

2,4 2,4 0

Tæng - 0,8

- 0,8/5 = - 0,16 d

Chøc n¨ng h« hÊp cña 5 bÖnh nh©n hen trưíc vµ sau khi dïng thuèc !

( )

( ).14,3

051,016,0

051,05114,0

114,0)}1/(])({[ 2

!=!

==

===

=

!!"=

d

d

d

d

SEdt

nsSE

sndds

Tra b¶ng t víi ®é tù do "

n - 1 = 4, ta cã p < 0,04 "§K: Ph©n bè cña d ph¶i chuÈn

Test cña Mc. Nemar

Tr­íc ®iÒu trÞ Tæng

ThÊp BT

Sau ®iÒu trÞ

ThÊp a b a + b

BT c d c + d

Tæng a + c b + d

2!

;cbOR =

Chøc n¨ng h« hÊp cña bÖnh nh©n hen trưíc vµ sau khi dïng thuèc

cbcb+

!=

22 )(

"

Page 15: Bài 7: PHÂN TÍCH SỐ LIỆUhpec.hmu.edu.vn/images/2013/12/Bai 7_ Phan tich so lieu... · 2013-12-22 · 12/20/13 1 Bài 7: PHÂN TÍCH SỐ LIỆU PGS.TS. Lưu Ngọc Hoạt Viện

12/20/13

15

Mann-Whitney U test v  ChØ ®Þnh: So s¸nh 2 nhãm ®éc lËp khi sè liÖu lµ

®Þnh l­îng hoÆc thø h¹ng, ph©n bè kh«ng chuÈn

•  VÝ dô: So s¸nh t¸c dông ®iÒu trÞ ®au ®Çu cña Aspirin vµ placebo th«ng qua viÖc tù cho ®iÓm cña bÖnh nh©n

Aspirin n=8 7,5 8,3 9,1 6,2 5,4 8,3 6,5 8,4

Placebo n=10 3,1 5,6 4,5 6,2 5,1 5,3 5,5 4,1 4,3 4,2

•  XÕp thø tù c¸c gi¸ trÞ ®iÓm trªn kh«ng ph©n biÖt nhãm

Quan s¸t 3,1 4,1 4,2 4,3 4,5 5,1 5,3 5,4 5,5

Thø tù 1 2 3 4 5 6 7 8 9

Quan s¸t 5,6 6,2 6,2 6,5 7,5 8,3 8,3 8,4 9,1 Thø tù 10 11,5 11,5 13 14 15,5 15,5 17 18

Mann-Whitney U test (tiÕp) v  TÝnh tæng xÕp h¹ng cña nhãm ®iÒu trÞ (aspirin): v  T = 8+11,5+13+14+15+16+17+18 = 112,5 v  TÝnh Z theo c«ng thøc:

v  Tra b¶ng Z ta ®­îc p <0,003

]12/)1([2/)1(

2121

211

++

++!=

nnnnnnnTZ

24,3]12/)1108(108[2/)1108(85,112=

++

++!=

xZ

Wilcoxon signed-rank test v  ChØ ®Þnh: So s¸nh 2 nhãm ghÐp cÆp khi sè liÖu lµ

®Þnh l­îng hoÆc thø h¹ng, ph©n bè kh«ng chuÈn

•  VÝ dô: So s¸nh ¶nh h­ëng cña sè n¨m uèng thuèc tr¸nh thai trªn bÖnh K vó trong 1 NC bÖnh-chøng ghÐp cÆp

CÆp 1 2 3 4 5 6 7 8 9 10

Ung th­ 2,0 10,0 7,1 2,3 3,0 4,1 10,0 10,5 12,1 15,0

Chøng 1,5 9,1 8,1 1,5 3,1 5,2 1,0 9,6 7,6 9,0

Chªnh lÖch 0,5 0,9 -1,0 0,8 -0,1 -1,1 9,0 0,9 4,5 6,0

Bá dÊu 0,5 0,9 1,0 0,8 0,1 1,1 9,0 0,9 4,5 6,0

Thø tù 2 4,5 6 3 1 7 10 4,5 8 9

Thø tù cã dÊu 2 4,5 -6 3 -1 -7 10 4,5 8 9

Wilcoxon signed-rank test (tiÕp)

v  TÝnh tæng thø h¹ng mang dÊu d­¬ng T (bá c¸c thø h¹ng mang dÊu ©m):

v  T = 2 + 4,5 + 3 + 10 + 4,5 + 8 + 9 = 41,0 v  ¸p dông c«ng thøc:

v  Tra b¶ng Z ta cã p = 0,16

]24/)12)(1([4/)1(

++

+!=

nnnnnTZ

4,1]24/)120)(110(10[

4/)110(1041=

++

+!=Z

Page 16: Bài 7: PHÂN TÍCH SỐ LIỆUhpec.hmu.edu.vn/images/2013/12/Bai 7_ Phan tich so lieu... · 2013-12-22 · 12/20/13 1 Bài 7: PHÂN TÍCH SỐ LIỆU PGS.TS. Lưu Ngọc Hoạt Viện

12/20/13

16

Ph©n tÝch håi quy vµ t­¬ng quan trong NCKH

C¸c b­íc x¸c ®Þnh mèi t­¬ng quan gi÷a 2 biÕn ®Þnh l­îng

1.  Chän biÕn thÝch hîp ®Ó x¸c ®Þnh mèi t­¬ng quan:!

2.  BiÓu thÞ mèi t­¬ng quan gi÷a 2 biÕn thÝch hîp b»ng biÓu ®å chÊm:!

3.  ViÕt ph­¬ng tr×nh håi quy tuyÕn tÝnh nÕu thÝch hîp !

4.  X¸c ®Þnh hÖ sè t­¬ng quan (r)!

1. Chän biÕn thÝch hîp ®Ó x¸c ®Þnh mèi t­¬ng quan:

* VÝ dô nµo d­íi ®©y lµ thÝch hîp ®Ó x¸c ®Þnh mèi t­¬ng quan gi÷a 2 biÕn ®Þnh l­îng:

v Hµm l­îng chÊt ®éc trong m¸u vµ chÊt ®éc trong n­íc tiÓu trªn 1 nhãm ®èi t­îng nghiªn cøu !

v Hµm l­îng mì trong thøc ¨n vµ hµm l­îng mì trong m¸u cña ng­êi ¨n th­êng ¨n thøc ¨n ®ã,!

v Sè l­îng hång cÇu trong m¸u vµ ®é cao n¬i ng­êi ®ã sèng so víi mÆt biÓn !

v ChiÒu cao thanh niªn gi÷a vïng thµnh thÞ vµ n«ng th«n !

v ChiÒu cao cña bè liªn quan ®Õn chiÒu cao cña con !

2. BiÓu thÞ mèi t­¬ng quan gi÷a 2 biÕn thÝch hîp b»ng biÓu ®å chÊm:

v VÏ ®å thÞ v Quan s¸t ®å thÞ, m« t¶ mèi t­¬ng quan:

Ø  Cã t­¬ng quan hay kh«ng? !

Ø  T­¬ng quan lµ tuyÕn tÝnh hay kh«ng? !

Ø  T­¬ng quan tuyÕn tÝnh cã râ rµng hay kh«ng? !

Ø  T­¬ng quan lµ thuËn hay nghÞch !

Ø  Cã thÓ viÕt ph­¬ng tr×nh håi quy tuyÕn tÝnh cho mèi t­¬ng quan hay kh«ng? !

Ø  Lµm thÕ nµo ®Ó c¶i thiÖn vµ x¸c ®Þnh ®óng mèi t­¬ng quan gi÷a hai biÕn sè nµy? !

²  B»ng biÖn ph¸p lµm s¹ch sè liÖu? ²  B»ng c¸ch t¸ch chia nhá bé sè liÖu?

Page 17: Bài 7: PHÂN TÍCH SỐ LIỆUhpec.hmu.edu.vn/images/2013/12/Bai 7_ Phan tich so lieu... · 2013-12-22 · 12/20/13 1 Bài 7: PHÂN TÍCH SỐ LIỆU PGS.TS. Lưu Ngọc Hoạt Viện

12/20/13

17

gr sbp age:

sbp

age 17 70 110

220

gr sbp age, s([_n])

drop in 70

sbp

age 17 70 110

220

1

2

3 4

5

6

7

8

9 10

11 12

13

14

15 16 17

18 19 20

21 22

23 24

25 26

27

28 29

30

31 32

33 34

35

36 37

38 39

40

41 42

43

44

45

46

47

48 49

50 51

52

53

54 55 56

57 58 59

60 61

62 63

64 65

66

67 68

69

70

sbp

age 17 70 110

185

- predict yhat - gr sbp yhat age, c(.l)

age

sbp

Fitted values

17 70 110

185

Page 18: Bài 7: PHÂN TÍCH SỐ LIỆUhpec.hmu.edu.vn/images/2013/12/Bai 7_ Phan tich so lieu... · 2013-12-22 · 12/20/13 1 Bài 7: PHÂN TÍCH SỐ LIỆU PGS.TS. Lưu Ngọc Hoạt Viện

12/20/13

18

3. Ph­¬ng tr×nh håi quy tuyÕn tÝnh

3.1. ViÕt ph­¬ng tr×nh: "D¹ng tæng qu¸t: * 'y = a + bx '!trong ®ã: *!v  X gi¸ trÞ cña biÕn ®éc lËp !v  Y gi¸ trÞ cña biÕn phô thuéc øng víi gi¸ trÞ X !v  b hÖ sè håi quy biÓu thÞ ®é dèc cña ®­êng håi quy:"

v  a lµ sè chÆn ®­îc tÝnh b»ng c«ng thøc: "v  Gi¸ trÞ a lµ b»ng y khi x b»ng 0 (zero). !

! !! ! !

!!

"

"=

"

""=

nx

x

nyx

yx

xx

yyxxb

ii

iiii

22

2 )(

))((

)())((

xbya !=

3.2. Xem xÐt mèi liªn quan gi÷a Y vµ X cã ý nghÜa thèng kª hay kh«ng?

v  KiÓm ®Þnh víi test t theo c«ng thøc: "

v  Tra b¶ng t víi ®é tù do = n - 2 ®Ó x¸c ®Þnh t t­¬ng øng víi α"

v  KÕt luËn dùa vµo sù kh¸c biÖt gi÷a t tra tõ b¶ng vµ t tÝnh tõ c«ng thøc."

2

222

)()2()()()(

XXnXXbYY

bbSEbt

!!

!!!==

"" "

3.3. ¦íc l­îng hÖ sè håi quy b tõ mÉu ra quÇn thÓ:

v  HÖ sè håi quy cña quÇn thÓ ®­îc ký hiÖu lµ β "v  Sè chÆn cña quÇn thÓ ®­îc ký hiÖu lµ α "v  C«ng thøc ­íc l­îng kho¶ng cho hÖ sè håi

quy β cña quÇn thÓ: " "

v  * Chó ý: HÖ sè håi quy β vµ sè chÆn α nµy kh¸c víi α vµ β trong x¸c ®Þnh ®é tin cËy "

2

222

2/ )()2()()(

XXnXXbYY

tb!!

!!!±

"" "

#

ViÕt ph­¬ng tr×nh håi quy theo STATA: LÖnh: reg sbp age

Source | SS df MS Number of obs = 69 ---------+------------------------------ F( 1, 67) = 121.27 Model | 14951.2546 1 14951.2546 Prob > F = 0.0000 Residual | 8260.51351 67 123.291246 R-squared = 0.6441 ---------+------------------------------ Adj R-squared = 0.6388 Total | 23211.7681 68 341.349531 Root MSE = 11.104

-------------------------------------------------------------------- sbp | Coef. Std. Err. t P>|t| [95% Conf. Interval] ---------+---------------------------------------------------------- age | .9833276 .0892947 11.012 0.000 .8050947 - 1.161561 _cons | 103.3491 4.331896 23.858 0.000 94.70256 - 111.9956 ----------------------------------------------------------

•  HuyÕt ¸p tèi ®a = 103,35 + 0,98 tuæi"

•  BiÕn tuæi ®ãng gãp 64% sù biÕn ®æi cña huyÕt ¸p tèi ®a "

Page 19: Bài 7: PHÂN TÍCH SỐ LIỆUhpec.hmu.edu.vn/images/2013/12/Bai 7_ Phan tich so lieu... · 2013-12-22 · 12/20/13 1 Bài 7: PHÂN TÍCH SỐ LIỆU PGS.TS. Lưu Ngọc Hoạt Viện

12/20/13

19

* §iÒu kiÖn ®Ó cã thÓ viÕt ®­îc ph­¬ng tr×nh håi quy gi÷a 2 biÕn ®Þnh l­îng

v  BiÓu ®å chÊm thÓ hiÖn mèi t­¬ng quan tuyÕn tÝnh râ"v  Cã 1 mèi quan hÖ nh©n qu¶ gi÷a 2 biÕn "v  BiÕn x ®­îc lùa chän bëi ng­êi nghiªn cøu (kh«ng

ngÉu nhiªn) trong khi biÕn y lµ ngÉu nhiªn."v  Ph©n bè c¸c gi¸ trÞ cña c¶ biÕn x vµ y ph¶i chuÈn, "v  Mét gi¸ trÞ cña x th­êng cho 1 tËp hîp c¸c gi¸ trÞ cña y

vµ chóng ph¶i cã c¸c ®iÒu kiÖn sau:"Ø  C¸c tËp hîp nµy ph¶i ®­îc ph©n bè chuÈn!Ø  Chóng cã cïng gi¸ trÞ ph­¬ng sai!Ø  Gi¸ trÞ trung b×nh cña c¸c tËp hîp nµy ph¶i n»m trªn 1 ®­

êng th¼ng (chÝnh lµ ®­êng håi quy)!

v  C¸c gi¸ trÞ y lµ ®éc lËp víi nhau, tøc lµ kh«ng phô thuéc vµo c¸c gi¸ trÞ kh¸c nhau cña x."

4. HÖ sè t­¬ng quan (r) v  ChØ ¸p dông víi 2 biÕn ®Þnh l­îng cã quan hÖ

nh©n qu¶, tuy nhiªn kh«ng cÇn biÕt biÕn nµo lµ phô thuéc hoÆc ®éc lËp !

!4.1. §o l­êng ®é lín cña t­¬ng quan: "v  HÖ sè t­¬ng quan "

v  HoÆc: ! !!

""

""=

22 )()(

))((

YYXX

YYXXr

! !! !! ! !

""

"=

2222 )()(

))((

iiii

iiii

yynxxn

yxyxnr

4.2. Mét sè ®Æc tÝnh cña hÖ sè tư¬ng quan (r):

v  ChØ biÓu thÞ mèi t­¬ng quan tuyÕn tÝnh!v  r dao ®éng trong kho¶ng tõ -1 ®Õn +1. !v  r cµng gÇn 1 hoÆc - 1 th× mèi t­¬ng quan gi÷a

2 biÕn cµng lín; !v  r cµng gÇn 0 (zero) th× t­¬ng quan cµng nhá. !

v  Khi r = 0, hai biÕn kh«ng cã sù t­¬ng quan tuyÕn tÝnh (nh­ng cã thÓ cã t­¬ng quan d¹ng kh¸c).!

v  r lµ hÖ sè t­¬ng quan x¸c ®Þnh tõ mÉu, trong khi hÖ sè t­¬ng quan cña quÇn thÓ lµ rho (ρ). !

4.3. KiÓm ®Þnh gi¶ thuyÕt cho gi¸ trÞ r:

v  Gi¶ thuyÕt *Ho: *ρ = 0 "* * * *Ha: *ρ ≠ 0"

v  Test thèng kª: * "

v  Tra b¶ng t-student víi ®é tù do = n - 2 vµ α t­¬ng øng. "

v  KÕt luËn: NÕu t tÝnh tõ c«ng thøc > t tra tõ b¶ng à tøc lµ p < α; Ho bÞ lo¹i bá vµ mèi t­¬ng quan gi÷a 2 biÕn cã ý nghÜa thèng kª vµ ng­îc l¹i. *"

22 12

)2()1()( r

nr

nrr

rSErt

!

!=

!!

==

Page 20: Bài 7: PHÂN TÍCH SỐ LIỆUhpec.hmu.edu.vn/images/2013/12/Bai 7_ Phan tich so lieu... · 2013-12-22 · 12/20/13 1 Bài 7: PHÂN TÍCH SỐ LIỆU PGS.TS. Lưu Ngọc Hoạt Viện

12/20/13

20

4.4. HÖ sè t­¬ng quan vµ hÖ sè x¸c ®Þnh:

v  Tham sè mÉu: *""v  Tham sè quÇn thÓ: *""v  ý nghÜa cña hÖ sè x¸c ®Þnh: "

2rr =2!! =

r2 = 0,25 r2 = 0,15 r2 = 0,50

Y Y Y X X X

5. VÝ dô vÒ mét sè bé sè liÖu kh«ng thÝch hîp víi håi quy vµ t­¬ng quan:

X1 ! Y1 ! X2 ! Y2 ! X3 ! Y3 ! X4 ! Y4 !10 " 8.04 " 10 " 9.14 " 10 " 7.46 " 8 " 6.58 "8 " 6.95 " 8 " 8.14 " 8 " 6.77 " 8 " 5.76 "13 " 7.58 " 13 " 8.74 " 13 " 12.74 " 8 " 7.71 "9 " 8.81 " 9 " 8.77 " 9 " 7.11 " 8 " 8.84 "11 " 8.33 " 11 " 9.26 " 11 " 7.81 " 8 " 8.47 "14 " 9.96 " 14 " 8.1 " 14 " 8.84 " 8 " 7.04 "6 " 7.24 " 6 " 6.13 " 6 " 6.08 " 8 " 5.25 "4 " 4.26 " 4 " 3.1 " 4 " 5.39 " 19 " 12.5 "12 " 10.84 " 12 " 9.13 " 12 " 8.15 " 8 " 5.56 "7 " 4.82 " 7 " 7.26 " 7 " 6.42 " 8 " 7.91 "5 " 5.68 " 5 " 4.74 " 5 " 5.73 " 8 " 6.89 "

- LÖnh: reg y1 x1 Source | SS df MS Number of obs = 11 ---------+------------------------------ F( 1, 9) = 17.99 Model | 27.5100011 1 27.5100011 Prob > F = 0.0022 Residual | 13.7626904 9 1.52918783 R-squared = 0.6665 ---------+------------------------------ Adj R-squared = 0.6295 Total | 41.2726916 10 4.12726916 Root MSE = 1.2366 -------------------------------------------------------------------- y1 | Coef. Std. Err. t P>|t| [95% Conf. Interval] ---------+---------------------------------------------------------- x1 | .5000909 .1179055 4.241 0.002 .2333701 - .7668117 _cons | 3.000091 1.124747 2.667 0.026 .4557369 - 5.544445 -------------------------------------------------------------------- - LÖnh: reg y2 x2 Source | SS df MS Number of obs = 11 ---------+------------------------------ F( 1, 9) = 17.97 Model | 27.5000024 1 27.5000024 Prob > F = 0.0022 Residual | 13.776294 9 1.53069933 R-squared = 0.6662 ---------+------------------------------ Adj R-squared = 0.6292 Total | 41.2762964 10 4.12762964 Root MSE = 1.2372 -------------------------------------------------------------------- y2 | Coef. Std. Err. t P>|t| [95% Conf. Interval] ---------+---------------------------------------------------------- x2 | .5 .1179638 4.239 0.002 .2331475 - .7668526 _cons | 3.000909 1.125303 2.667 0.026 .4552978 - 5.54652 --------------------------------------------------------------------

- LÖnh: reg y3 x3 Source | SS df MS Number of obs = 11 ---------+------------------------------ F( 1, 9) = 17.97 Model | 27.4700075 1 27.4700075 Prob > F = 0.0022 Residual | 13.7561905 9 1.52846561 R-squared = 0.6663 ---------+------------------------------ Adj R-squared = 0.6292 Total | 41.2261979 10 4.12261979 Root MSE = 1.2363 -------------------------------------------------------------------- y3 | Coef. Std. Err. t P>|t| [95% Conf. Interval] ---------+---------------------------------------------------------- x3 | .4997273 .1178777 4.239 0.002 .2330695 - .7663851 _cons | 3.002455 1.124481 2.670 0.026 .4587014 - 5.546208 -------------------------------------------------------------------- - LÖnh: reg y4 x4 Source | SS df MS Number of obs = 11 ---------+------------------------------ F( 1, 9) = 18.00 Model | 27.4900007 1 27.4900007 Prob > F = 0.0022 Residual | 13.7424908 9 1.52694342 R-squared = 0.6667 ---------+------------------------------ Adj R-squared = 0.6297 Total | 41.2324915 10 4.12324915 Root MSE = 1.2357 -------------------------------------------------------------------- y4 | Coef. Std. Err. t P>|t| [95% Conf. Interval] ---------+---------------------------------------------------------- x4 | .4999091 .1178189 4.243 0.002 .2333841 - .7664341 _cons | 3.001727 1.123921 2.671 0.026 .4592411 - 5.544213

Page 21: Bài 7: PHÂN TÍCH SỐ LIỆUhpec.hmu.edu.vn/images/2013/12/Bai 7_ Phan tich so lieu... · 2013-12-22 · 12/20/13 1 Bài 7: PHÂN TÍCH SỐ LIỆU PGS.TS. Lưu Ngọc Hoạt Viện

12/20/13

21

LÖnh reg Y1 X1 LÖnh reg Y2 X2

LÖnh reg Y3 X3 LÖnh reg Y4 X4

Page 22: Bài 7: PHÂN TÍCH SỐ LIỆUhpec.hmu.edu.vn/images/2013/12/Bai 7_ Phan tich so lieu... · 2013-12-22 · 12/20/13 1 Bài 7: PHÂN TÍCH SỐ LIỆU PGS.TS. Lưu Ngọc Hoạt Viện

12/20/13

22

Ph©n biÖt sai sè ngÉu nhiªn vµ sai sè hÖ thèng

ooooooooooooooooo

oo oooo

oooooooooo oooooooooooooooooooooooo

oooooooooo oooo oo

Sai sè"hÖ thèng"

May rñi"

80 " 90 "mmHg"

A (®óng)"

"B (sai)"

"

Sai sè ngÉu nhiªn vµ sai sè hÖ thèng

** ******

** ******

* * * * *

* * * * * * *

* *

* * * * *

* * * * * * *

* *

Kh¸i niÖm vÒ nhiÔu

Møc ®é lÖ thuéc insulin T!nh tr"ng sèng sãt Kh«ng Cã Sèng 326 253 ChÕt 218 105 Tæng 544 358 Tû lÖ chÕt 40% 29%

Møc ®é lÖ thuéc insulin T!nh tr"ng sèng sãt Kh«ng Cã Sèng 15 129 ChÕt 0 1 Tæng 15 130 Tû lÖ chÕt 0% 1%

Møc ®é lÖ thuéc insulin T!nh tr"ng sèng sãt Kh«ng Cã Sèng 311 124 ChÕt 218 104 Tæng 529 228 Tû lÖ chÕt 41% 46%

TÇng 1: Tuæi bÖnh nh©n ≤ 40 " TÇng 2: Tuæi bÖnh nh©n > 40 "

Kh¸i niÖm vÒ nhiÔu vµ t¸c ®éng t­¬ng hç

Lo¹i nghiªn cøu !Gi¸ trÞ chung vµ theo tÇng !

NhËn xÐt!TÇng 1 ! TÇng 2 !

Chung 2 tÇng (crude) !

1 2 3

ThuÇn tËp (RR) ThuÇn tËp (RR) BÖnh chøng (OR)

1,02 1,74 0,96

1,86 3,00 0,45

4,00 1,00 1,83

NhiÔu vµ cã t¸c ®éng t­¬ng hç gi÷a c¸c tÇng

4 5 6

ThuÇn tËp (RR) ThuÇn tËp (RR) BÖnh chøng (OR)

4,00 1,00 1,83

4,00 1,00 1,83

4,00 1,00 1,83

Kh«ng nhiÔu vµ kh«ng cã t¸c ®éng t­¬ng hç

7 8 9

ThuÇn tËp (RR) ThuÇn tËp (RR) BÖnh chøng (OR)

1,01 3,00 0,83

1,01 3,00 0,83

4,00 1,00 1,83

NhiÔu vµ kh«ng cã t¸c ®éng t­¬ng hç

10 11 12

ThuÇn tËp (RR) ThuÇn tËp (RR) BÖnh chøng (OR)

1,07 3,00 0,36

9,40 0,33 6,00

4,00 1,00 1,83

T¸c ®éng t­¬ng hç rÊt lín àlµm lu mê nhiÔu

Page 23: Bài 7: PHÂN TÍCH SỐ LIỆUhpec.hmu.edu.vn/images/2013/12/Bai 7_ Phan tich so lieu... · 2013-12-22 · 12/20/13 1 Bài 7: PHÂN TÍCH SỐ LIỆU PGS.TS. Lưu Ngọc Hoạt Viện

12/20/13

23

Ph¬i nhiÔm BÖnh Tæng

Cã Kh«ng

Cã 200 800 1000

Kh«ng 50 950 1000

Tæng 250 1,750 2,000

TÇng 1: Cã yÕu tè nhiÔu

Ph¬i nhiÔm

BÖnh Tæng

Cã Kh«ng

Cã 194 706 900

Kh«ng 21 79 100

Tæng 215 785 1000

TÇng 2: Kh«ng cã YT nhiÔu

Ph¬i nhiÔm

BÖnh Tæng

Cã Kh«ng

Cã 6 94 100

Kh«ng 29 871 900

Tæng 35 965 1000

00.41000/501000/200

==cRR

02.1100/21900/194

1 ==RR 86.1900/29100/6

2 ==RR

RR hiÖu chØnh = 1.14 !

VÝ dô vÒ viÖc ph©n tÝch tÇng khö nhiÔu Ph­¬ng ph¸p khö nhiÔu tèi ­u

v Håi quy ®a biÕn:

Y = a + b1X1 + b2X2 + b3X3 +...... + biXi

v Håi quy logistics

)...( 33221111

ii xbxbxbxbaeY +++++!+=

Mét sè test thèng kª th­êng dïng kh¸c

Công thức Kappa

Người đánh giá 1 + - ∑

Người đánh giá 2

+ a b p1

- c d q1

∑ p2 q2 1 1221

)(2qpqpbcadK

+

!=

Giá trị của Kappa (K) Cách giải thích > 0,75 Rất đồng ý

0,40 - 0,75 Đồng ý (vừa phải) < 0,40 Không đồng ý

Page 24: Bài 7: PHÂN TÍCH SỐ LIỆUhpec.hmu.edu.vn/images/2013/12/Bai 7_ Phan tich so lieu... · 2013-12-22 · 12/20/13 1 Bài 7: PHÂN TÍCH SỐ LIỆU PGS.TS. Lưu Ngọc Hoạt Viện

12/20/13

24

Ví dụ (bảng tần số)

Kỹ thuật viên XQ 1

+ - Tổng số film đọc

Kỹ thuật viên XQ 2

+ 1.467 1.309 2.776

- 782 16.232 17.014

Tổng số film đọc 2.249 17.541 19.790

Chuyển sang bảng tỷ lệ

Kỹ thuật viên XQ 1

+ - Tỷ lệ film đọc

Kỹ thuật viên XQ 2

+ 0,0741 0,0662 0,1403

- 0,0395 0,8202 0,8597

Tỷ lệ film đọc 0,1136 0,8864 1

Cách tính giá trị Kappa

Kỹ thuật viên XQ 1 + - Tỷ lệ film đọc

KTV XQ 2

+ 0,0741 (a) 0,0662 (b) 0,1403 (p1)

- 0,0395 (c) 0,8202 (d) 0,8597 (q1)

Tỷ lệ film đọc 0,1136 (p2) 0,8864 (q2) 1

5240,0)8597,0)(1136,0()8864,0)(1403,0()]0395,0)(0661,0()8202,0)(0741,0[(2=

+!

=K

1221

)(2qpqpbcadK

+

!=

Tổng quát: Bảng tần số

Chuyên gia 1

+ - Tổng số

Chuyên gia 2

+ a b (a + b)

- c d (c + d)

Tổng số (a + c) (b + d) n

Page 25: Bài 7: PHÂN TÍCH SỐ LIỆUhpec.hmu.edu.vn/images/2013/12/Bai 7_ Phan tich so lieu... · 2013-12-22 · 12/20/13 1 Bài 7: PHÂN TÍCH SỐ LIỆU PGS.TS. Lưu Ngọc Hoạt Viện

12/20/13

25

Tổng quát: Bảng tỷ lệ

Chuyên gia 1

+ - Tỷ lệ

Chuyên gia 2

+ a/n b/n (a + b)/n

- c/n d/n (c + d)/n

Tỷ lệ (a + c)/n (b + d)/n n/n