50
ТОЙМ СТАТИСТИК Б.Батзориг , НЭМС, ЭБТэнхим 1

тойм статистик лекц 2

Embed Size (px)

Citation preview

ТОЙМ СТАТИСТИК

Б.Батзориг , НЭМС, ЭБТэнхим

1

АГУУЛГА

Төвийн хандлага ба байршлын

үзүүлэлтүүд

Хэлбэлзэл

Тархалт, тархалтын хэлбэрүүд

2

ТОЙМ СТАТИСТИК

Өгөгдөл цуглуулах

Асуумж гм

Анхдагч, хоѐрдогч эх үүсвэр

Өгөгдлийг илтгэх

Хүснэгт, график гм

Статистик : Түүврийн мэдээллийг илтгэх тоон

утга

Түүврийн дундаж гм

3

ӨГӨГДӨЛ ЦУГЛУУЛАХ

Өгөгдөл цуглуулах

Асуумж Туршилт

Утсаар Ажиглалт

4

5

Статистикүүд

Төвийн үзүүлэлт Байршлын үзүүлэлт Хэлбэлзэл

Арифметик дундаж

Голч утга/медиан

Моод

Квартил

Децил

Перцентил

Завсар

Стандарт хазайлт

Дисперс

Вариацын коэф

Тоон ұгұгдлүүдийг ганц тоогоор тұлұұлүүлж

илэрхийлэх боломжтой юу?

6

Төвийн үзүүлэлт

(Central Tendency)

Арифметик дундаж Голч утга/медиан Моод Бусад дундаж

ДУНДАЖ ХЭМЖИГДЭХҮҮН

Тодорхойлолт:

Үзэгдэл юмсын судлагдаж буй шинж

тэмдэгийн нэгдсэн нэг үзүүлэлт бөгөөд

үзэгдэл юмсын бүрдүүлж буй

нэгжүүдийг төлөөлж чадахуйц

хэмжигдэхүүн юм.

7

ХЭРЭГЛЭЭ

Дундажийг үзэгдлүүдийн:

одоогийн түвшин

харилцан хамаарал

прогноз

нормативийг г.м тооцоолоход ашигладаг.

8

ЗЭРГИЙН ДУНДАЖИЙН ЕРӨНХИЙ ТОМЪЁО

K –аас хамаарч зэргийн дундажийн хэлбэрүүдийг

гарган авч болно.

9

k

k

n

XX

_

АРИФМЕТИК ДУНДАЖ

Зэргийн дундажууд дотроос хамгийн түгээмэл

хэрэглэгддэг.

K=1

энгийн арифметик дундаж

Түүвэр олонлог нэгэн төрөл байх

10

_ XX

n

ЖИШЭЭ

11

151412

жин

i x i

1 12.6

2 12.9

3 13.4

4 12.2

5 13.6

6 13.5

7 12.6

8 13.1

12.99

max

min

0.138

104

8

1.13..9.126.12

8

8

i

ix

x

АРИФМЕТИК ДУНДАЖ

Алслагдсан утга (extreme values) нөлөөлдөг.

12

N1 1 2 3 4 5

0.35

54321

5

5

11

i

ix

x

N1 1 2 3 4 10

0.65

104321

5

5

12

i

ix

x

ÃÅÎÌÅÒÐ ÄÓÍÄÀÆ

Ê=0

Xэðýãëýгээ

• Ìýäýýëýë ìàø èõ õýëáýëçýëòýé ¿åä

• % - илэрхийлэгдсэн мэдээлэл

1 2 ...ãåînn

nX X X X X

13

МООД

Шинж тэмдгүүдийн хамгийн олон

давтагддаг утгыг МООД гэнэ.

Mo гэж тэмдэглэдэг.

Моодгүй, олон моодтой байж

болно.

14

ЖИШЭЭ

Хөх

Ногоон

Ногоон

Улаан

Улаан

Улаан

Улаан

Шар

Шар

Шар

Mоод

=Улаан

20

29

34

41

41

42

43

45

45

Олон

моодтой

1.1

2.3

4.1

5.3

4.3

6.7

8.2

Моодгүй

15

МЕДИАН

Төв дунд нь орших утгыг МЕДИАН (50%,50%-аар

хуваадаг) гэнэ.

Me гэж тэмдэглэдэг.

Хэт өндөр эсвэл бага утгуудын оролцоо

нөлөөлдөггүй.

16

1.1 2.3 4.1 4.3 5.3 6.7 8.2

Ме50% 50%

КВАРТИЛ (ВOX PLOT)

Хамгийн

бага утга Q1 Meдиан Q3Хамгийн

их утга

25%

50%

75%

1.1 2.3 4.1 4.3 5.3 6.7 8.2

Q1 Ме Q217

ДЕЦИЛЬ ПЕРЦЕНТИЛЬ

Дециль

9 цэгээр хуваадаг. Харгалзан d1 (10%), d2

(20%),…d9 (90%) тэмдэглэдэг.

Перцентиль

Мэдээллийг 99 цэгээр хуваадаг. Харгалзан p1

(1%), p2 (2%),…p99 (99%) тэмдэглэдэг.

18

ХЭЛБЭЛЗЛИЙН ҮЗҮҮЛЭЛТҮҮД

19

ХЭРЭГЛЭЭ

Судлагдаж хүчин зүйлийн хэлбэлзлийн

тодорхойлсноор:

Олонлогийн нэгэн төрлийн байдал

Норматив

Хүчин зүйл хоорондын хамаарал гэх мэт.

20

АНГИЛАЛ

21

Хэлбэлзлийн үзүүлэлтүүд

Абсолют үзүүлэлт Харьцангуй үзүүлэлт

Завсар/Range

Стандарт хазайлт

Дисперс

Вариацын коэф

АБСОЛЮТ ҮЗҮҮЛЭЛТҮҮД

Тод: Судлагдаж буй олонлогийн утга

холбогдлуудын дундажаасаа хазайх

хазайлтыг хэлбэлзэл гэнэ.

x1,x2,..xn n хэмжээст олонлог өгөгдсөн

дундаж гэвэл хэлбэлзэл нь :

22

_

X

ДАЛАЙЦ

Далайц нь тоон мэдээллийн хамгийн их утга ба

хамгийн бага утгын зөрүүг харуулдаг.

R=Xmax-Xmin

R=Xmax-Xmin=8.2-1.1=7.123

1.1 2.3 4.1 4.3 5.3 6.7 8.2

Хамгийн

бага утга

Хамгийн

их утга

ДАЛАЙЦЫН СУЛ ТАЛ

R=Xmax-Xmin

R1=Xmax-Xmin=8.2-1.1=7.1

R2=Xmax-Xmin=8.2-1.1=7.1

24

N1 1.1 2.3 4.1 4.3 5.3 6.7 8.2

N2 1.1 1.2 1.3 1.4 1.5 1.6 8.2

ТҮҮВРИЙН ДИСПЕРС

Тооцох томъёо:

25

2

2

1s X X

n

( )

Түүврийн дисперсээр эх олонлогийн

хэлбэлзлийг үнэлдэг

ЖИШЭЭ

N X

1 1.1 -3.47 12.04

2 2.3 -2.27 5.15

3 4.1 -0.47 0.22

4 5.3 0.73 0.53

5 4.3 -0.27 0.07

6 6.7 2.13 4.54

7 8.2 3.63 13.18

Дундаж 4.57 0.01 35.73

26

XX 2XX

95.573.35

1

2

2

n

XXs

ТҮҮВРИЙН СТАНДАРТ ХАЗАЙЛТ

Тооцох томъёо:

27

N X

1 1.1 -3.47 12.04

2 2.3 -2.27 5.15

3 4.1 -0.47 0.22

4 5.3 0.73 0.53

5 4.3 -0.27 0.07

6 6.7 2.13 4.54

7 8.2 3.63 13.18

Дундаж 4.57 0.01 35.73

44.2

6

73.35

1

2

n

XXs

1

2

n

XXs

ЖИШЭЭ

28

81.293.7 s

866.075.0 s

ЗАВСРЫН КВАРТИЛ

Хамгийн

бага утга Q1 Meдиан Q3Хамгийн

их утга

1.1 2.3 4.1 4.3 5.3 6.7 8.2

Q1 Ме Q2

1.1 2.3 4.3 6.7 8.2

4.42.3-6.7Q1-Q3квартил Завсрын

29

ХАРЬЦАНГУЙ ДИСПЕРС

Судлагдаж буй хүчин зүйл нь альтернатив шинжтэй

байх нь олон тохиолддог.

p - шинж тэмдэгийн нийт олонлогт эзлэх хувийн жин

q - эсрэг шинж тэмдэгийн хувийн жин

30

pqs 2

ЖИШЭЭ

Эрүүл мэндийн байгууллагын ажиллагсдын В

гепатитийн судалгаа хийгджээ. Халдвартай хүмүүс

нь 30 % -ийг эзэлж байг(p=0.3). Халдвар илрээгүй нь

70% байна(q=0.7).

δ2=pq=0.3*0.7=0.21

31

ВАРИАЦЫН КОЭФФИЦИЕНТ

33 % бага гарч байвал түүвэр олонлогийг төлөөлөх

чадвар сайтай гэж үздэг.

32

%100*x

sVs

ЖИШЭЭ

Тооцох томъёо:

33

N X

1 1.1 -3.47 12.04

2 2.3 -2.27 5.15

3 4.1 -0.47 0.22

4 5.3 0.73 0.53

5 4.3 -0.27 0.07

6 6.7 2.13 4.54

7 8.2 3.63 13.18

Дундаж 4.57 0.01 35.73

44.2

6

73.35

1

2

n

XXs

%39.53%10057.4

44.2%100

x

sVs

ДАВТАЖИЙН ТАРХАЛТ

Бүлэглэсэн тоон өгөгдөл

Тархалтын тухай мэдээлэл өгдөг.

Зарим тохиолдолд тоон өгөгдлийг бүлэглэж анализ

хийх болдог.

• Жишээлбэл: Даралт, нас

Давтамжийн тархалтыг ихэнхдээ гистограмаар

дүрсэлдэг.

340

5

10

15

20

25

5-10 10-1515-2020-2525-3030-3535-4040-45

Да

вта

мж

Нас

35

Дундаж=Медиан

Хоёр моодтойДундаж=Медиан=Моод

50%

Хонх хэлбэрийн муруй Бимодал тархалт

36

Моод

Медиан

Дундаж

50%

Моод Дундаж

50%

Медиан

Баруун тал руугаа

Хазайлттай тархалтЗүүн тал руугаа

Хазайлттай тархалт

37

ХЭВИЙН ТАРХАЛТ ЯАГААД ЧУХАЛ ВЭ?

Олон үзэгдлүүд хэвийнтэй ойролцоогоор тархсан

байдаг. Жишээ нь давсны, өндөр

Статистикийн олон аргууд хэвийн тархалтаар

тархсан олонлогт зориулагдсан байдаг.

Т тестүүд

ANOVA

Регрессийн шинжилгээ гэх мэт

38

ХЭВИЙН ТАРХАЛТЫГ ШИНЖЛЭХ

39

Графикийн аргууд Тоон аргууд

Дескриптив Навч-ба-үндэс,

box plot,

гистограмм

Skewness, Kurtosis

Онол P-P plot

Q-Q plot

Kolmogorov-

Smirnov test,

1. Эрэмбэлсэн тоон өгөгдөл 2. Эрэмбэлсэн тоон өгөгдөл

-1 1 2 2 3 3 3 4 4 4 4 5 5 5 6 6 7 9 1 1 1 1 1 1 3 3 4 6 7 7 9 9 9 9 9 9

Min = -1, Q1 = 3, Meдиан = 4, Q3 = 5,

Max = 9

Min = 1, Q1 = 1, Meдиан = 5, Q3 = 9,

Max = 9

40

41

ЭХ ОЛОНЛОГИЙН ДУНДАЖИЙН ИТГЭХ

ИНТЕРВАЛ ТООЦОХ

Интевалын доод хязгаарыг тооцох

Интевалын дээд хязгаарыг тооцох

n=25, α=0.05 (95% CI)

[362.12 ; 373.88]

(үрлгэлжлэл)

12.36225

15)96.1(3682/1

nZXL

88.37325

15)96.1(3682/1

nZXU

41

ЭХ ОЛОНЛОГИЙН ТАРХАЛТ

π = эх олонлогт эзлэх үзэгдлийн тархалт

Түүврийн тархалт (p) π-ийн үнэлгээ:

0 ≤ p ≤ 1

n хангалттай их үед p хэвийн тархалт руу дөхдөг.

n

Давтамж

n

Xp

42

Интевалын доод хязгаарыг тооцох

Интевалын дээд хязгаарыг тооцох

n=10000, α=0.05 (95% CI)

[0.036 ; 0.044]

036.0

10000

04.0104.096.104.0

1

n

ppZpL

044.0

10000

04.0104.096.104.0

1

n

ppZpL

43

СТАТИСТИКИЙН ҰГҰГДЛҮҮДИЙГ ИЛЭРХИЙЛЭХ ҰРГҰН

ХЭРЭГЛЭГДДЭГ ГРАФИКИЙН ТҰРЛҮҮД

Графикийн

төрөл

Графикаар дүрслэх гэж буй

хувьсагчийн төрөл

Графикаар илэрхийлэх зорилго,

шалтгаан

Гистограмм Тасралтгүй тоон хувьсагч Нас өндөр гэх мэт тамралтгүй

тоон хувьсагчдын давтамжийн

тархалтыг харуулах

Тэгш өнцөгт

диаграмм

Чанарын хувьсагч эсвэл

тасралттай тоон хувьсагч

Чанарын эсвэл тасралттай тоон

хувьсагчийн тоо хэмжээ, давтамж,

хувийг харуулах, өөр хооронд нь

харьцуулахад хэрэглэнэ.

Шугаман

диаграмм

Тоон болон чанарын

хувьсагчдын аль алины

ерөнхий чиг хандлагыг

харуулсан хамааралтай тоон

утгууд

Цаг хугацаа, нас зэргээс

хамаарсан тоо хэмжээ, эзлэх

хувийн ерөнхий чиг хандлагыг

харуулахад гол төлөв хэрэглэнэ.

44

45Age in years

75,0

70,0

65,0

60,0

55,0

50,0

45,0

40,0

35,0

30,0

25,0

20,0

1200

1000

800

600

400

200

0

Std. Dev = 12,29

Mean = 42,1

N = 6400,00

46

500

600

700

800

900

1000

1100

1200

1300

1980 1985 1990 1995 2000 2005 2010

KyrgyzstanCISCARK

Hospital beds per 100000

СТАТИСТИКИЙН ҰГҰГДЛҮҮДИЙГ ИЛЭРХИЙЛЭХ ҰРГҰН

ХЭРЭГЛЭГДДЭГ ГРАФИКИЙН ТҰРЛҮҮД

Графикийн

төрөл

Графикаар дүрслэх гэж буй

хувьсагчийн төрөл

Графикаар илэрхийлэх зорилго,

шалтгаан

Тойргийн

диаграмм

Чанарын болон тоон хувьсагчийн

ангилал

Нийт түүврийг хэт олон бус дэд

хэсгүүдэд хувааж ангилсан

тохиолдолд хэрхэн хуваарилагдсаныг

харуулах

Хэсэгчилсэн

тэгш өнцөгт

диаграм

Чанарын болон тоон хувьсагчийн

ангилал

Дугуй диаграммтай ижил боловч 2

болон түүнээс дээш бүлэг өгөгдлийг

хооронд нь харьцуулж харуулахад

илүүтэй хэрэглэнэ

Цэгэн

диаграм

Тоон хувьсагч (тасралттай эсвэл

тасралтгүй)

2 тасралтгүй тоон хувьсагчийн

хоорондын хаммарлыг харуулах

зорилгоор хэрэглэнэ

47

48

49

Figure 6: Health expenditure, by sources of financing (1996-2003)

Source: MoH, Health sector, 2003

58.651.6

60.9 64.3 67.6 64.168.9

37.842.3

31.8 28.7 2628.5

24.9

3.5 6.1 7.3 7.1 6.4 7.4 6.1

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

1996 1998 1999 2000 2001 2002 2003

State budget Health Insurance Fund User fee and others

АНХААРАЛ ТАВЬСАНД БАЯРЛАЛАА

50