Upload
zorigoosph
View
10.275
Download
1
Embed Size (px)
Citation preview
ТОЙМ СТАТИСТИК
Өгөгдөл цуглуулах
Асуумж гм
Анхдагч, хоѐрдогч эх үүсвэр
Өгөгдлийг илтгэх
Хүснэгт, график гм
Статистик : Түүврийн мэдээллийг илтгэх тоон
утга
Түүврийн дундаж гм
3
5
Статистикүүд
Төвийн үзүүлэлт Байршлын үзүүлэлт Хэлбэлзэл
Арифметик дундаж
Голч утга/медиан
Моод
Квартил
Децил
Перцентил
Завсар
Стандарт хазайлт
Дисперс
Вариацын коэф
Тоон ұгұгдлүүдийг ганц тоогоор тұлұұлүүлж
илэрхийлэх боломжтой юу?
6
Төвийн үзүүлэлт
(Central Tendency)
Арифметик дундаж Голч утга/медиан Моод Бусад дундаж
ДУНДАЖ ХЭМЖИГДЭХҮҮН
Тодорхойлолт:
Үзэгдэл юмсын судлагдаж буй шинж
тэмдэгийн нэгдсэн нэг үзүүлэлт бөгөөд
үзэгдэл юмсын бүрдүүлж буй
нэгжүүдийг төлөөлж чадахуйц
хэмжигдэхүүн юм.
7
ХЭРЭГЛЭЭ
Дундажийг үзэгдлүүдийн:
одоогийн түвшин
харилцан хамаарал
прогноз
нормативийг г.м тооцоолоход ашигладаг.
8
ЗЭРГИЙН ДУНДАЖИЙН ЕРӨНХИЙ ТОМЪЁО
K –аас хамаарч зэргийн дундажийн хэлбэрүүдийг
гарган авч болно.
9
k
k
n
XX
_
АРИФМЕТИК ДУНДАЖ
Зэргийн дундажууд дотроос хамгийн түгээмэл
хэрэглэгддэг.
K=1
энгийн арифметик дундаж
Түүвэр олонлог нэгэн төрөл байх
10
_ XX
n
ЖИШЭЭ
11
151412
жин
i x i
1 12.6
2 12.9
3 13.4
4 12.2
5 13.6
6 13.5
7 12.6
8 13.1
12.99
max
min
0.138
104
8
1.13..9.126.12
8
8
i
ix
x
АРИФМЕТИК ДУНДАЖ
Алслагдсан утга (extreme values) нөлөөлдөг.
12
N1 1 2 3 4 5
0.35
54321
5
5
11
i
ix
x
N1 1 2 3 4 10
0.65
104321
5
5
12
i
ix
x
ÃÅÎÌÅÒÐ ÄÓÍÄÀÆ
Ê=0
Xэðýãëýгээ
• Ìýäýýëýë ìàø èõ õýëáýëçýëòýé ¿åä
• % - илэрхийлэгдсэн мэдээлэл
1 2 ...ãåînn
nX X X X X
13
МООД
Шинж тэмдгүүдийн хамгийн олон
давтагддаг утгыг МООД гэнэ.
Mo гэж тэмдэглэдэг.
Моодгүй, олон моодтой байж
болно.
14
ЖИШЭЭ
Хөх
Ногоон
Ногоон
Улаан
Улаан
Улаан
Улаан
Шар
Шар
Шар
Mоод
=Улаан
20
29
34
41
41
42
43
45
45
Олон
моодтой
1.1
2.3
4.1
5.3
4.3
6.7
8.2
Моодгүй
15
МЕДИАН
Төв дунд нь орших утгыг МЕДИАН (50%,50%-аар
хуваадаг) гэнэ.
Me гэж тэмдэглэдэг.
Хэт өндөр эсвэл бага утгуудын оролцоо
нөлөөлдөггүй.
16
1.1 2.3 4.1 4.3 5.3 6.7 8.2
Ме50% 50%
КВАРТИЛ (ВOX PLOT)
Хамгийн
бага утга Q1 Meдиан Q3Хамгийн
их утга
25%
50%
75%
1.1 2.3 4.1 4.3 5.3 6.7 8.2
Q1 Ме Q217
ДЕЦИЛЬ ПЕРЦЕНТИЛЬ
Дециль
9 цэгээр хуваадаг. Харгалзан d1 (10%), d2
(20%),…d9 (90%) тэмдэглэдэг.
Перцентиль
Мэдээллийг 99 цэгээр хуваадаг. Харгалзан p1
(1%), p2 (2%),…p99 (99%) тэмдэглэдэг.
18
ХЭРЭГЛЭЭ
Судлагдаж хүчин зүйлийн хэлбэлзлийн
тодорхойлсноор:
Олонлогийн нэгэн төрлийн байдал
Норматив
Хүчин зүйл хоорондын хамаарал гэх мэт.
20
АНГИЛАЛ
21
Хэлбэлзлийн үзүүлэлтүүд
Абсолют үзүүлэлт Харьцангуй үзүүлэлт
Завсар/Range
Стандарт хазайлт
Дисперс
Вариацын коэф
АБСОЛЮТ ҮЗҮҮЛЭЛТҮҮД
Тод: Судлагдаж буй олонлогийн утга
холбогдлуудын дундажаасаа хазайх
хазайлтыг хэлбэлзэл гэнэ.
x1,x2,..xn n хэмжээст олонлог өгөгдсөн
дундаж гэвэл хэлбэлзэл нь :
22
_
X
ДАЛАЙЦ
Далайц нь тоон мэдээллийн хамгийн их утга ба
хамгийн бага утгын зөрүүг харуулдаг.
R=Xmax-Xmin
R=Xmax-Xmin=8.2-1.1=7.123
1.1 2.3 4.1 4.3 5.3 6.7 8.2
Хамгийн
бага утга
Хамгийн
их утга
ДАЛАЙЦЫН СУЛ ТАЛ
R=Xmax-Xmin
R1=Xmax-Xmin=8.2-1.1=7.1
R2=Xmax-Xmin=8.2-1.1=7.1
24
N1 1.1 2.3 4.1 4.3 5.3 6.7 8.2
N2 1.1 1.2 1.3 1.4 1.5 1.6 8.2
ТҮҮВРИЙН ДИСПЕРС
Тооцох томъёо:
25
2
2
1s X X
n
( )
Түүврийн дисперсээр эх олонлогийн
хэлбэлзлийг үнэлдэг
ЖИШЭЭ
N X
1 1.1 -3.47 12.04
2 2.3 -2.27 5.15
3 4.1 -0.47 0.22
4 5.3 0.73 0.53
5 4.3 -0.27 0.07
6 6.7 2.13 4.54
7 8.2 3.63 13.18
Дундаж 4.57 0.01 35.73
26
XX 2XX
95.573.35
1
2
2
n
XXs
ТҮҮВРИЙН СТАНДАРТ ХАЗАЙЛТ
Тооцох томъёо:
27
N X
1 1.1 -3.47 12.04
2 2.3 -2.27 5.15
3 4.1 -0.47 0.22
4 5.3 0.73 0.53
5 4.3 -0.27 0.07
6 6.7 2.13 4.54
7 8.2 3.63 13.18
Дундаж 4.57 0.01 35.73
44.2
6
73.35
1
2
n
XXs
1
2
n
XXs
ЗАВСРЫН КВАРТИЛ
Хамгийн
бага утга Q1 Meдиан Q3Хамгийн
их утга
1.1 2.3 4.1 4.3 5.3 6.7 8.2
Q1 Ме Q2
1.1 2.3 4.3 6.7 8.2
4.42.3-6.7Q1-Q3квартил Завсрын
29
ХАРЬЦАНГУЙ ДИСПЕРС
Судлагдаж буй хүчин зүйл нь альтернатив шинжтэй
байх нь олон тохиолддог.
p - шинж тэмдэгийн нийт олонлогт эзлэх хувийн жин
q - эсрэг шинж тэмдэгийн хувийн жин
30
pqs 2
ЖИШЭЭ
Эрүүл мэндийн байгууллагын ажиллагсдын В
гепатитийн судалгаа хийгджээ. Халдвартай хүмүүс
нь 30 % -ийг эзэлж байг(p=0.3). Халдвар илрээгүй нь
70% байна(q=0.7).
δ2=pq=0.3*0.7=0.21
31
ВАРИАЦЫН КОЭФФИЦИЕНТ
33 % бага гарч байвал түүвэр олонлогийг төлөөлөх
чадвар сайтай гэж үздэг.
32
%100*x
sVs
ЖИШЭЭ
Тооцох томъёо:
33
N X
1 1.1 -3.47 12.04
2 2.3 -2.27 5.15
3 4.1 -0.47 0.22
4 5.3 0.73 0.53
5 4.3 -0.27 0.07
6 6.7 2.13 4.54
7 8.2 3.63 13.18
Дундаж 4.57 0.01 35.73
44.2
6
73.35
1
2
n
XXs
%39.53%10057.4
44.2%100
x
sVs
ДАВТАЖИЙН ТАРХАЛТ
Бүлэглэсэн тоон өгөгдөл
Тархалтын тухай мэдээлэл өгдөг.
Зарим тохиолдолд тоон өгөгдлийг бүлэглэж анализ
хийх болдог.
• Жишээлбэл: Даралт, нас
Давтамжийн тархалтыг ихэнхдээ гистограмаар
дүрсэлдэг.
340
5
10
15
20
25
5-10 10-1515-2020-2525-3030-3535-4040-45
Да
вта
мж
Нас
36
Моод
Медиан
Дундаж
50%
Моод Дундаж
50%
Медиан
Баруун тал руугаа
Хазайлттай тархалтЗүүн тал руугаа
Хазайлттай тархалт
ХЭВИЙН ТАРХАЛТ ЯАГААД ЧУХАЛ ВЭ?
Олон үзэгдлүүд хэвийнтэй ойролцоогоор тархсан
байдаг. Жишээ нь давсны, өндөр
Статистикийн олон аргууд хэвийн тархалтаар
тархсан олонлогт зориулагдсан байдаг.
Т тестүүд
ANOVA
Регрессийн шинжилгээ гэх мэт
38
ХЭВИЙН ТАРХАЛТЫГ ШИНЖЛЭХ
39
Графикийн аргууд Тоон аргууд
Дескриптив Навч-ба-үндэс,
box plot,
гистограмм
Skewness, Kurtosis
Онол P-P plot
Q-Q plot
Kolmogorov-
Smirnov test,
1. Эрэмбэлсэн тоон өгөгдөл 2. Эрэмбэлсэн тоон өгөгдөл
-1 1 2 2 3 3 3 4 4 4 4 5 5 5 6 6 7 9 1 1 1 1 1 1 3 3 4 6 7 7 9 9 9 9 9 9
Min = -1, Q1 = 3, Meдиан = 4, Q3 = 5,
Max = 9
Min = 1, Q1 = 1, Meдиан = 5, Q3 = 9,
Max = 9
40
41
ЭХ ОЛОНЛОГИЙН ДУНДАЖИЙН ИТГЭХ
ИНТЕРВАЛ ТООЦОХ
Интевалын доод хязгаарыг тооцох
Интевалын дээд хязгаарыг тооцох
n=25, α=0.05 (95% CI)
[362.12 ; 373.88]
(үрлгэлжлэл)
12.36225
15)96.1(3682/1
nZXL
88.37325
15)96.1(3682/1
nZXU
41
ЭХ ОЛОНЛОГИЙН ТАРХАЛТ
π = эх олонлогт эзлэх үзэгдлийн тархалт
Түүврийн тархалт (p) π-ийн үнэлгээ:
0 ≤ p ≤ 1
n хангалттай их үед p хэвийн тархалт руу дөхдөг.
n
Давтамж
n
Xp
42
Интевалын доод хязгаарыг тооцох
Интевалын дээд хязгаарыг тооцох
n=10000, α=0.05 (95% CI)
[0.036 ; 0.044]
036.0
10000
04.0104.096.104.0
1
n
ppZpL
044.0
10000
04.0104.096.104.0
1
n
ppZpL
43
СТАТИСТИКИЙН ҰГҰГДЛҮҮДИЙГ ИЛЭРХИЙЛЭХ ҰРГҰН
ХЭРЭГЛЭГДДЭГ ГРАФИКИЙН ТҰРЛҮҮД
Графикийн
төрөл
Графикаар дүрслэх гэж буй
хувьсагчийн төрөл
Графикаар илэрхийлэх зорилго,
шалтгаан
Гистограмм Тасралтгүй тоон хувьсагч Нас өндөр гэх мэт тамралтгүй
тоон хувьсагчдын давтамжийн
тархалтыг харуулах
Тэгш өнцөгт
диаграмм
Чанарын хувьсагч эсвэл
тасралттай тоон хувьсагч
Чанарын эсвэл тасралттай тоон
хувьсагчийн тоо хэмжээ, давтамж,
хувийг харуулах, өөр хооронд нь
харьцуулахад хэрэглэнэ.
Шугаман
диаграмм
Тоон болон чанарын
хувьсагчдын аль алины
ерөнхий чиг хандлагыг
харуулсан хамааралтай тоон
утгууд
Цаг хугацаа, нас зэргээс
хамаарсан тоо хэмжээ, эзлэх
хувийн ерөнхий чиг хандлагыг
харуулахад гол төлөв хэрэглэнэ.
44
45Age in years
75,0
70,0
65,0
60,0
55,0
50,0
45,0
40,0
35,0
30,0
25,0
20,0
1200
1000
800
600
400
200
0
Std. Dev = 12,29
Mean = 42,1
N = 6400,00
46
500
600
700
800
900
1000
1100
1200
1300
1980 1985 1990 1995 2000 2005 2010
KyrgyzstanCISCARK
Hospital beds per 100000
СТАТИСТИКИЙН ҰГҰГДЛҮҮДИЙГ ИЛЭРХИЙЛЭХ ҰРГҰН
ХЭРЭГЛЭГДДЭГ ГРАФИКИЙН ТҰРЛҮҮД
Графикийн
төрөл
Графикаар дүрслэх гэж буй
хувьсагчийн төрөл
Графикаар илэрхийлэх зорилго,
шалтгаан
Тойргийн
диаграмм
Чанарын болон тоон хувьсагчийн
ангилал
Нийт түүврийг хэт олон бус дэд
хэсгүүдэд хувааж ангилсан
тохиолдолд хэрхэн хуваарилагдсаныг
харуулах
Хэсэгчилсэн
тэгш өнцөгт
диаграм
Чанарын болон тоон хувьсагчийн
ангилал
Дугуй диаграммтай ижил боловч 2
болон түүнээс дээш бүлэг өгөгдлийг
хооронд нь харьцуулж харуулахад
илүүтэй хэрэглэнэ
Цэгэн
диаграм
Тоон хувьсагч (тасралттай эсвэл
тасралтгүй)
2 тасралтгүй тоон хувьсагчийн
хоорондын хаммарлыг харуулах
зорилгоор хэрэглэнэ
47
49
Figure 6: Health expenditure, by sources of financing (1996-2003)
Source: MoH, Health sector, 2003
58.651.6
60.9 64.3 67.6 64.168.9
37.842.3
31.8 28.7 2628.5
24.9
3.5 6.1 7.3 7.1 6.4 7.4 6.1
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
1996 1998 1999 2000 2001 2002 2003
State budget Health Insurance Fund User fee and others