36
1 وري ر س ل د . طه ا عامة ل ا حة ص ل ا ارة ور- وث ح ب ل ! ا ج م ا رن ب

الاحصاء و تحليل البيانات

  • Upload
    -

  • View
    456

  • Download
    2

Embed Size (px)

Citation preview

Page 1: الاحصاء و تحليل البيانات

1

السروري . طه دوزارةالصحة - البحوث برنامج

العامة

Page 2: الاحصاء و تحليل البيانات

2

Page 3: الاحصاء و تحليل البيانات

3

المركزية النزعة مقاييسMeasures of central tendency

• ً عددا أ%%ن نج%%د التوزيعات م%%ن كثي%%ر ف%%يالتجم%ع إل%ى يمي%ل المفردات م%ن ك%بيراًعدد ويق%ل معين%ة متوس%طة قيم%ة حولهذه ع%%ن بعدن%%ا كلم%%ا تدريجياً المفرداتمرك%%ز تمث%%ل الت%%ي المتوس%%طة القيم%%ةالنزع%%ة الظاهرة هذه تس%%مى و التوزي%%عالمختلف%ة المفردات نزع%ة أ%ي المركزي%ة

التوزيع مركز حول التجمع .إلى المركزية النزعة مقاييس أو تعرف بالمتوسطات.المعدالت

: المقاييس منها أهم لكل مقاييس عدة توجدوعيوبه : مميزاته

الحسابي -1 - 3الوسيط- 2المتوسطالمنوال

Page 4: الاحصاء و تحليل البيانات

4

الطبيعي غير SkewedالتوزيعDistribution

التوزيع منحنى%الطبيعي

Normal Curve

الطبيعي NormalالتوزيعDistribution

Left skewness- Longer left tail- Most values are on the right- Few low values- Mean< Median< Mode

Right skewness- Longer right tail- Most values are on the left- Few high values- Mean> Median> Mode

Page 5: الاحصاء و تحليل البيانات

5

Page 6: الاحصاء و تحليل البيانات

6

الحسابي • أكثر: Arithmetic Mean المتوسط

بقسمة عليه ونحصل استخداماً المقاييس . لدينا كانت فإذا عددها على القيم مجموع

س س 1القيم ،2 : فإن... ن س

ن+....+ 2س+1سس%%%% = • س = س مج%ن • ن• : عدد : ن الحسابي، المتوسط س%%%% حيث

: القيم مجموع س مج% القيم،

Page 7: الاحصاء و تحليل البيانات

7

• : ه%ي: مرض%ى لخمس%ة اليوري%ا قي%م كان%ت إذا ، 20، 17.5مثال23.5 ،15 ،19 = الحسابي المتوسط فإن

17.5+20+23.5+15+19= 95 = 19/ ديسسلتر مليجرام 5 5

. المتطرفة بالقيم تأثرة الحسابي المتوسط عيوب ومن

، :Median الوس%يط- المنتص%ف ف%ي تق%ع الت%ي القيم%ة ه%و. متطرفة قيم وجود حالة في عليه االعتماد ويفضل

هذه نرت%%ب فإنن%%ا المفردات م%%ن لمجموع%%ة الوس%%يط إليجاد ) القيم%%ة ) نج%%د ث%%م أوتنازلياً تص%%اعدياً ترتيباً المجموع%%ةالقي%م م%ن العدد نف%س ويليه%ا يس%بقها الت%ي المتوس%طة

: تساوي القيمة وهذه+ و 1ن الفردي%%ة القي%%م حال%%ة حال%%ة 1 +ن، نف%%ي ف%%ي

الزوجية القيم 2 2 2

المتوسط بإيجادللعددين الحسابي

األوسطين

Page 8: الاحصاء و تحليل البيانات

8

المرضى: 1مثال• من لسبعة الدم بروتين قيم كانت إذا/ ... 7، 5، 7، 8، 6، 6، 5هي: فلحساب ديسلتر مليجرام

: التالي علينا يجب فإنه الوسيط- : المفردات 7 6 5 4 3 2 1: الموقعترتيب

8 7 7 6 6 5 5: القيم : الفردية للقيم : 4 = 1+7 = 1ن+الوسيط الرابعة القيمة أي

دل/6 ملجم 2 2

: 2مثال هي: المرضى من لستة اليوريا قيم كانت ، 17.5إذاحسابه 52، 19، 15، 23.5، 23، 20 يمكن الوسيط فإن

كالتالي: : المفردات 6 5 4 3 2 1: الموقعترتيب

52 23.5 20 19 17.5 15: القيم : الزوجية للقيم 4=1+3 = 1 + 6و 3= 6 = 1 +نو نالوسيط

2 2 22بالقيم%%ة/ ) 19.5= 39 = 20+19الوس%%يط= يتأث%%ر ل%%م دل ملج%%م

المتطرفة( 2 2

Page 9: الاحصاء و تحليل البيانات

9

أكثر: Mode المنوال• تحدث التي القيمة هوفإذا شيوعاً األكثر القيمة هو أي غيرها من

: القيم لدينا كانتأكثر 3القيمة : 7، 3، 4، 3، 9، 13، 4، 3• تكررت

. المجموعة منوال تعتبر ولذلك غيرها منمنوال: 1، 5، 12، 7، 9، 13، 4، 2• اليوجدحيث: 1، 5، 12، 7، 5، 3، 9، 4، 3• منوالين فنجد

القيمتين من 5كل نفس ،3 تكررت قد . المرات من العدد

Page 10: الاحصاء و تحليل البيانات

10

التشتت مفهوم

التشتت مقاييسMeasures of dispersion

التفاوت • درج%ة ب%ه يقص%د القي%م م%ن مجموع%ة أ%ي ف%ي التشت%تقي%%م كان%%ت فإذا المجموع%%ة هذه قي%%م بي%%ن االختالف أ%%و ً ص%غيرا% التشت%ت يكون البع%ض بعضه%ا م%ن متقارب%ة المجموع%ةيكون متباين%%ة أ%%ي البع%%ض بعضه%%ا ع%%ن متباعدة كان%%ت وإذا

. ً كبيرا التشتت• ) المتوس%%طات ) المركزي%%ة النزع%%ة مقايي%%س أ%%ن وج%%د لق%%د

فق%د ، القي%م ف%ي التفاوت مدى ع%ن واضح%ة ص%ورة التعط%يم%ن بالرغ%م ال%بيانات م%ن لمجموعتي%ن المتوس%طات تتس%اوى

: ً فمثال بينهما اختالف وجودالس%كر • م%ن التالي%ة القي%م وجدت المرض%ى م%ن مجموعتي%ن ف%ي

: الدم في : األولى /100، 90، 80، 70، 60المجموعة ديسلتر ملجم : الثانية /82، 81، 80، 79، 78المجموعة ديسلتر ملجملهاتي%%ن • الوس%%يط وكذا الحس%%ابي المتوس%%ط أ%%ن يالح%%ظ

ه%و متقارب%ة 8المجموعتي%ن الثاني%ة المجموع%ة قي%م أ%ن إالّ ،بي%ن ) بينه%ا فه%ي( 82-78فيم%ا األول%ى المجموع%ة قي%م أم%ا ،

أوسع ) مجال في وتقع (. 100-60متباعدة

Page 11: الاحصاء و تحليل البيانات

11

:Rangeالمدى - 1قيمة أعلى بين الفرق وهو التشتت لقياس طريقة أسهل

: . المدى فإن السابق المثال في البيانات في قيمة وأصغر = األولى ديسلتر/40=60-100المجموعة ملجمالثانية = /4=78-82المجموعة ديسلتر ملجم

:Varianceالتباين - 2عن البيانات من مجموعة قيم اختالف لمدى مقياس هو

. مربعات متوسط عن عبارة وهو الحسابي وسطها. الحسابي وسطها عن القيم انحرافات : التالية بالخطوات نقوم التباين ولحساب

وكل- القيم لهذه الحسابي المتوسط بين الفرق نحسب - : س س منها %%%%واحد

- س- ) المربعات على فنحصل الفروق هذه من واحد كل نربع2(%%%%س

التشتت مقايييس أنواع أهم

Page 12: الاحصاء و تحليل البيانات

12

ع - بالرمز مثالَ لها ونرمز المربعات هذه - مج%= 2نجمع س)2(%%%%س

المجموعة –- قيم عدد على المجموع هذا -1نقسم (1ن )ع: - - مج%= 2التباين س) 2(%%%%س

1ن- : الدم في السكر لنسبة مثالنا 100، 90، 80، 70، 60ففي

ديسلتر/ ملجم/ 80 = %%%%س ديسلتر س- (ملجم

%%%%س (2س- %%%%س س

400 -20 60

100 -10 70

0 0 80

100 +10 90

400 +20 100

1000مج%=

250 = 1000= 2ع

2ديسلتر/2ملجم4

Page 13: الاحصاء و تحليل البيانات

13

المعياري -3 االنحرافStandard deviation

وأكثره%ا • التشت%ت مقايي%س أه%م وه%وحس%اب ف%ي لدخول%ه وذل%ك اس%تخداماًاإلحص%%%ائية المقايي%%%س م%%%ن كثي%%%رالجذر. ع%%%%%%ن عبارة وه%%%%%%و األخرى

. للتباين التربيعيع • المعياري - مج%%%%%%%%% =2االنحراف س)

2(%%%%س

1ن-

: السابق المثال وفي 15.8 = 250ع =

ديسلتر/ ملجم

Page 14: الاحصاء و تحليل البيانات

14

بين )أ( المعيارية الدرجات تتراوح(3و-3)+

، )ب( الجانبين متماثل المنحنىالتي القيم مجموع ألن وذلك

مجموع يساوي المعدل تفوقولهذا ، عنه تقل التي القيم

ب ) المعدل قيمة وفي( . 0تمثلالوسيط مع المعدل تطابق حالة

تفوق التي القيم عدد فانالتي القيم عدد يساوي المعدل

عنه . تقل ) المنحنى) تحت المنطقة ج

: يقع حيث بين% 68.27معروفة( 1و –1)+

( 2و –2 )+بين % 95.45

(3و –3بين )+99.73%

Page 15: الاحصاء و تحليل البيانات

15

في%( 68.27% )68تقريباً تقع العينة منالمعدل : من واحد معياري ± انحراف

1SD

بين ) + (1و – 1تقع المعدل جانبي على

Page 16: الاحصاء و تحليل البيانات

16

في%( 95.45% )95تقريباً تقع العينة منالمعدل من معياريين SD 2: ± انحرافين

بين) + (2و – 2تقع المعدل جانبي على

Page 17: الاحصاء و تحليل البيانات

17

في%( 99.73% )99تقريباً تقع العينة منالمعدل 3 من معيارية SD 3: ± انحرافات

بين) + (3و – 3تقع المعدل جانبي على

Page 18: الاحصاء و تحليل البيانات

18

100 110 1209080-1 sd 1 sd 2 sd-2 sd

الحسابي = 100المتوسط

المعياري = 10اإلنحراف

Page 19: الاحصاء و تحليل البيانات

19

= النساء من لعدد الطول واإلنحراف 64.5متوسطبوصة 2.5المعياري=

Page 20: الاحصاء و تحليل البيانات

20

Page 21: الاحصاء و تحليل البيانات

21

المتغيرات • بي%%%ن العالق%%%ة إليجاد تس%%%تخدمالنوعية.

الص%%%%%%حية • : Health indicatorsالمؤشراتلتحلي%%ل أ%%و معي%%ن وض%%ع لوص%%ف تس%%تخدم . الذي% العدد ه%%%%%%%و والمؤش%%%%%%%ر ما ظاهرةالمشكل%ة حج%م قياس م%ن نتمك%ن بواس%طتهدراس%%%ته المرغوب الص%%%%حي الوض%%%%ع أ%%%%و

: إلى وتنقسم

النوعية المتغيرات مقاييس

Ratio النسبةIndex المعاملProportion التناسبPercentage المئوية النسبةRate المعدل

Page 22: الاحصاء و تحليل البيانات

22

بي%%%ن • العالق%%%ة لقياس رياضي%%%ة أداة ه%%%يالعناص%%ر تكون وفيه%%ا مطلقتي%%ن قيمتي%%نالعناص%%ر ع%%ن مختلف%%ة للبس%%ط المكون%%ة . ويرم%ز النوعية حي%ث م%ن للمقام المكون%ة

أ: لهاب

عدد : • المس%%%%تشفيات، إحدى ف%%%%ي فمثالًاألطباء 300الممرضات نس%بة 50وعدد فإ%ن ،

لألطباء = 6 = 300/50الممرضاتهناك أ%ن ويمك%ن . 6أ%ي ط%بيب لك%ل ممرضات

نس%%بة أ%%و للمرضات األس%%رة نس%%بة إيجاد. وهكذا األسرة لعدد األطباء

في مضروبة النسبة X100أ= 100هيب

النسبة

المعامل

أ من كل حيثظاهرة يمثل وب

مختلفة

Page 23: الاحصاء و تحليل البيانات

23

• . وفيها قيمتين بين العالقة لقياس أداة وهيللمقام النوعية الخصائص نفس للبسط يكون

.) لها) ويرمز المقام من جزء أ البسط

ن

إحدى • في للعاملين الكلي العدد كان إذا فمثالًالممرضات 1200المستشفيات وعدد فإن 300، ،

للعاملين = الكلي للعدد الممرضات تناسبلكل 0.25= ¼= 300/1200 ممرضة .4أي عاملين

في • مضروب التناسب 100هو

هو المعدل استخدام من الهدفوحدة خالل معين حدث حدوث كثافة قياس

الذي. الفعلي العدد بين العالقة ويمثل الزمنالفعلي والعدد معينة ظاهرة فيه حدثت

محدد زمن في الظاهرة لهذه للمعرضين / ن أ لها ويرمز محددة، جغرافية Xومنطقة

ن10

التناسب

المئوية النسبة

للعناصر أ ) الكلي العدد ن و دراستها، يراد التي القيمةأ القيمة لها تنتمي )التي

المعدل

Page 24: الاحصاء و تحليل البيانات

24

Page 25: الاحصاء و تحليل البيانات

25

ف%ي • تجميعه%ا بع%د ال%بيانات وض%ع الجدول%ي بالعرض ويقص%د. إحصائية جداول

• : العنوان، ه%%ي رئيس%%ية أجزاء ثالث%%ة م%%ن جدول أ%%ي يتكون.) المالحظات ) التذييل نفسه، الجدول

الجدول - 1 نف%س: عنوان ف%ي ومختص%راً كامالً يكون أ%ن يج%بالوقت .

-. : وأين متى، كيف، ماذا، األسئلة على يجيب أن يجب-. جدول لكل رقم إعطاء يجبنفس%%%ه - 2 الرأس%%%ية: الجدول األعمدة م%%%ن عدد م%%%ن يتكون

) بص%ورة ) ال%بيانات تظه%ر الت%ي األفقي%ة األس%طر والص%فوف. ً معا آن في ومرتبة مفصلة

يود: التذيي%ل-3 ايضاحات أ%ي ويتضم%ن الجدول أس%فل ويكت%ب. البيانات مصدر وكذلك إيضاحها الباحث

الجدولي العرض

Page 26: الاحصاء و تحليل البيانات

26

من • الجدول يحويه عما معبراً الجدول عنوان يكون أنبيانات.

•. واألعمدة الصفوف من لكل بارزة عناوين توضع أنإن ) • األعمدة أو للصفوف المستخدمة الوحدات تحدد أن

وجدت(.•. األهمية حسب الجدول في البيانات ترتب أن•.) كليهما ) أو للمجموع عمود أو صف على يحتوي أن يجب•. اإلمكان قدر بالبيانات مزدحماً اليكون أن

•1. الواحد- المتغير جدول•2.) أكثر- ) أو متغيرين المتقاطعة الجداول

: الجداول إلنشاء العامة القواعد

: الجداول أنواع

Page 27: الاحصاء و تحليل البيانات

27

الواحد المتغير جدول

رقم ) (1جدول ) ( ، س منطقة في التدخين حسب المرضى توزيع

م2000النسبة المرضى العدد

46%54%

6374

المدخنين

غير المدخني

ن100% 137 اإلجمالي

توجد 3ملحوظة: ال استماراتإجابة فيها

Page 28: الاحصاء و تحليل البيانات

28

لوص%ف أكث%ر أ%و متغيري%ن ف%ي المعلومات دم%ج ف%ي تس%تخدم. لها معقولة تفسيرات إلى الوصول أو المشكلة

رقم ) ( 2جدولمنطقة في المدخنين وغير المدخنين بين السعال نوبات

) (، م2000س

: المتقاطعة (Cross- tables)الجداول

اإلجماليسعال يوجد ال

آخر فييومين

في سعاليومين آخر المرضى

4654

6374

42.357.7

5271

78.621.4

113

المدخنينالمدخنين غير

100 137 100 123 100 14 اإلجمالي

العدد

العدد

العدد

%*%*%*

. األعمدة* مجموع من مأخوذة النسب

Page 29: الاحصاء و تحليل البيانات

29

ص%ورة • ف%ي ال%بيانات ع%ن التع%بير الهندس%ي بالعرض يقص%دنق%%ط، ) أعمدة، أ%%و مس%%تطيالت هندس%%ية وأشكال رس%%وم

.) غيرها أو دوائر خطوط،يتكون • الت%ي الثالث%ة األجزاء نف%س م%ن بيان%ي رس%م أ%ي يتكون

: التذيي%%%ل نفس%%%ه، الرس%%%م العنوان، ه%%%ي و الجدول منه%%%ا.) المالحظات)

• : المتغير نوع على الهندسي الرسم نوع يعتمدالمنفصلة • والعددية النوعية Bar chartاألعمدة: للمتغيرات

Pie chartالدوائر المتصلة • العددية التكراري: للمتغيرات Histogramالمدرج

التكراري Frequency Polygonالمضلعبالزمن • العالقة ذات البياني: للبيانات Line graphالخط

) البياني ) الهندسي العرض

Page 30: الاحصاء و تحليل البيانات

30

آ%ن • ف%ي ومختص%راً كامالً يكون أ%ن يج%ب ال%بياني الرس%م عنوان. الجدول عنوان صفات نفس ويحمل واحد

• ) حي%ن ) ف%ي األفق%ي المحور عل%ى المتغي%ر الظاهرة تمثي%ل يت%م ) النس%بة ) أ%و التكرار المقابل%ة القي%م الرأس%ي المحور يمث%ل

. مناسب رسم مقياس باستعمال وذلك• .) وجدت ) إن القياس وحدة ذكر مع المحاور تسمية يجبهذه • وف%ي متغي%ر م%ن أكث%ر تمثي%ل يمك%ن األعمدة حال%ة ف%ي

. الرسم مفتاح كتابة يجب الحالة•. متساوية وبمسافات الصفر من يبدأالقياسمتس%اوية • مس%افة ترك م%ع متس%اوية تكون أ%ن يج%ب األعمدة

نص%ف ع%ن المس%افة هذه تق%ل االّ عل%ى وآخ%ر عمود ك%ل بي%ن . عليه تزيد واالّ العمود عرض

: البياني للرسم العامة القواعد

Page 31: الاحصاء و تحليل البيانات

31

األعمدة

Page 32: الاحصاء و تحليل البيانات

32

األعمدة

ذكورإناث

32 36

308 283

050

100150200250300350

ا%لعدد

و%%زننا%قص وزنطبي%عي ال%والدة ا%لوزنعند

ا )2( شكل مست%شفىا%ل%وحدة،عدن، 1993 والوزنعندا%لوال%دة، الموا%ليدحسبال%نو%ع

Page 33: الاحصاء و تحليل البيانات

33

التكراري المدرج

19.3

10.8

3526.5

8.4

0.00%5.00%

10.00%15.00%20.00%25.00%30.00%35.00%

)3( شكل )2001-1997( -عدن ت%سجي%لالسرطا%ن مر%ك%ز سرطا%نالقول%ونحسبالعمر،

<40 40- 50- 60- 70+ا%لعمربال%سنين

%

Page 34: الاحصاء و تحليل البيانات

34

الدوائر

37.50%

58.80%

3.70%

ϝϛηˬΔϧϣγϟϝϭΣέηΎϧϥϳϣ ΩϬόϣΔΑϠρϑ ϗ ϭϣΩϳλ έ

ϳΣλ ϑ ϗϭϣ

ο ϭέϳϑ ϗϭϣϏ

ϳΣλ έϳϑ ϗϭϣϏ

= القطاع المطلق% زاوية النسبة أو X 360 التكرار X 360

الكلي 100العدد

Page 35: الاحصاء و تحليل البيانات

35

البياني خال ط

0

10

20

30

40

50

60

70

80

1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990

)5( شكل )س( 1990-1980 فيمن%طقة وفيا%تال%رضع

مولودحي ا%لمعدل/1000

السنوات

Page 36: الاحصاء و تحليل البيانات

36

الخات

مة