92
אאאא אאאאאאאאאא א' אאא אא[email protected] 054-5793060

מבוא לסטטיסטיקה א

Embed Size (px)

DESCRIPTION

מבוא לסטטיסטיקה א'. מגל לס [email protected] 054-5793060. אז למה לי סטטיסטיקה עכשיו?. כל מחקר שמבוסס על נתונים אמפיריים דורש ידע בסטטיסטיקה , על מנת שנוכל לארגן את הנתונים, לנתח ולהסיק מהם מסקנות . בסמסטר א', אנו מתמקדים בסטטיסטיקה תיאורית. סטטיסטיקה תיאורית. - PowerPoint PPT Presentation

Citation preview

Page 1: מבוא לסטטיסטיקה א

מבוא לסטטיסטיקה א'

מגל לס[email protected]

054-5793060

Page 2: מבוא לסטטיסטיקה א

אז למה לי סטטיסטיקה עכשיו?

כל מחקר שמבוסס על נתונים אמפיריים דורש •ידע בסטטיסטיקה, על מנת שנוכל לארגן את

הנתונים, לנתח ולהסיק מהם מסקנות.בסמסטר א', אנו מתמקדים בסטטיסטיקה •

תיאורית.

Page 3: מבוא לסטטיסטיקה א

סטטיסטיקה תיאורית

סטטיסטיקה תיאורית עוסקת בשיטות •לארגון, ותמצות הנתונים

שנאספו במחקר הסטטיסטי.•הנושאים בהם נתמקד:•

. מיון משתנים לפי מהות.1. מיון משתנים לפי רמת המדידה.2. הצגת נתונים ע"י טבלת שכיחויות 3

וגרפים.

Page 4: מבוא לסטטיסטיקה א

מיון משתנים על פי מהות

משתנה

כמותי

רציף בדיד

נומינאלי

Page 5: מבוא לסטטיסטיקה א

מיון משתנים על פי מהות

משתנה איכותי- ערכי המשתנה נבחנים •לפי סוג איכותי ללא ביטוי במספרים.

!מיליםמשמע- לדוגמא: מין, מצב משפחתי.

משתנה כמותי- ערכי המשתנה מציינים •מספרים.כמות. הקטגוריות הן

לדוגמא: גיל, שכר, ותק, מספר ילדים.

Page 6: מבוא לסטטיסטיקה א

מיון משתנים על פי מהות

כמותי בדיד- ערכי משתנים בדידים.• בין כל שני ערכים של המשתנה, קיים

מספרסופי של ערכים ובין שני ערכים קבועים מתקיימת קפיצה.

למשל: מס' ילדים, מספר איחורים, מס' חדרים.

אין חצי ילד, אין חצי איחור אמנם יש כיום חצי חדר אבל גם קפיצה זו היא

מדידה.

Page 7: מבוא לסטטיסטיקה א

הבדל בין כמותי בדיד לבין רציף

כמותי בדיד •

כמותי רציף•

Page 8: מבוא לסטטיסטיקה א

מיון משתנים לפי רמת מדידה

משתנה נומינאלי )שמי(- ערכי המשתנה נבחנים •אין משמעות לסדר שבין לפי שמות/סוגים, כאשר

. )לדוג': מין, מצב משפחתי, מס' טלפון( הערכיםניתן רק להבחין בין שני המשתנים. מי שזכר הוא

a=bלא נקבה. משתנה אורדינאלי )סדר(- יש חשיבות לסדר, ניתן •

לסדר את הערכים מהנמוך לגבוה. )דרגות משתנה זה יכול להופיע גם כאיכותי וגם בצבא(.

3, סמל-2, רב"ט-1כמותי: טוראי- ככמותי: a>b, a=b

איכותי: כלל לא מרוצה, מרוצה, מרוצה מאוד.

Page 9: מבוא לסטטיסטיקה א

מיון משתנים לפי רמת המדידהערכי המשתנה במספרים, יש - משתנה אנטרוואלי )רווח( •

משמעות למרווחים שבין הערכים, ניתן לחשב את ההפרשים אפס מוחלט לא מעיד על העדר ביניהם. לא קיים אפס מוחלט!

)בד"כ מדובר על משתנים שהומצאו ע"י בני האדם -התופעה!כמו: טמפ', ציון פסיכומטרי(.

ערכי המשתנה במספרים, קיים ערך אפס משתנה יחס )מנה(- •מוחלט, ניתן לחלק ערך אחד בשני ולציין מה היחס ביניהם.

)כמו - משקל, גובה וגיל(.

משתנה נומינאלי הוא ברמת המדידה הנמוכה ביותר.•וכולל את משתנה יחס הוא בעל רמת המדידה הגבוהה ביותר •

כל התכונות של קודמיו!

Page 10: מבוא לסטטיסטיקה א

1שאלה

רשמו לגבי כל אחד מהמשתנים את סוגו:•א. איכותי, כמותי-בדיד, כמותי- רציף.

ב. נומינאלי, אורדינלי, אינטרוולי, יחס.

משקל המרצים בחוג לסטטיסטיקה.1.

צבע החולצות של הבנים בכתה.2.

מספרי הטלפון של המרצים במכללה.3.

ארץ מוצאם של פועלים במפעל.4.

הזמן שלוקח לכל אחד מהסטודנטים לפתור תרגיל זה.5.

גובהו של מועמד לקורס קצונה.6.

קווי האוטובוסים הנוסעים ברחוב הרצל.7.

Page 11: מבוא לסטטיסטיקה א

)ממבחן(2שאלה

בסקר שנערך ע"י "מכון לשאלות לא חשובות" •התבקשו הנשאלים לענות על שמונה שאלות. להלן

אחת השאלות מתוך סקר זה: ₪ לחודש.5000 המשכורת הממוצעת בישראל הינה

המשכרות שלך הינה )בשקלים חדשים(:•1 )1 - 2499. •2 )2500 - 4999. •3 )5000 -7500. .7000( מעל 4•ברור שהמשתנה הנבחן )לגביו המכון שואל את •

השאלה( הינו משתנה איכותי – יחס. נכון / לא נכון.

Page 12: מבוא לסטטיסטיקה א

הצגת נתונים בטבלת שכיחויות

חלקי הסה"כ.X: חישוב ערך חישוב שכיחות יחסית•F)X(

N.100: הנ"ל כפול חישוב שכיחות יחסית מצטברת באחוזים•

F)X( *100 N

מדובר על שכיחות חישוב שכיחות יחסית מצטברת באחוזים %: •יחסית הכוללת שהתקבלה, הקטנה או שווה לערך הנתון.

מחברים את התוצאות עד לאותו ערך כולל.•

Page 13: מבוא לסטטיסטיקה א

הצגה גרפית

דרך נוחה וברורה להבלטת התופעה הנחקרת.•בסטטיסטיקה תיאורית קיימות שלוש הצגות גראפיות בהתאם •

לסוג המשתנה:מתאימה : דיאגרמת מעגל1.

למשתנה איכותי נומינאלי.כיצד בונים דיאגרמת מעגל?

א. מחשבים שכיחות יחסית לכל משתנה.

ב. משרטטים מעגל ומחלקים את השטח שלו לגזרות.

ג. יש להקפיד ששטחה של כל גזרה תהיה פרופורציונאלית לשכיחות המקרים.

מצב משפחתי מס' העולים

רווק/ה 3,638

נשוי/אה 5,539

גרוש/ה 992

אלמן/ה 741

לא ידוע 2

סה"כ 10,912

Page 14: מבוא לסטטיסטיקה א

הצגה גרפית

מתאימה לתיאור משתנה : דיאגרמת מקלות. 2איכותי אורדניאלי.ומשתנה כמותי בדיד

כיצד בונים דיאגרמת מקלות? Xא. בונים מערכת צירים של

.Y ו- נציג את הערכים Xב. על ציר ה-

( Xשל המשתנה הנחקר )(.F נציג את השכיחות )Yועל ציר ה-

נציב מקל באורך Xג. מעל כל ערך של משתנה פרופורציונאלי לשכיחות המקרים.

שביעות הרצון מספר סטודנטים

לא רוצים 1

נמוכה 3

בינונית 2

טובה 4

טובה מאוד 2

סה"כ 12

Page 15: מבוא לסטטיסטיקה א

הצגה גרפית

הצגה גרפית זו מתאימה היסטוגרמה )דיאגראמת מלבנים(:. 3למשתנה כמותי רציף, אינטרוואלי או יחס.

כיצד בונים דיאגראמת מלבנים? ( וצפיפות 1א. מצרפים לטבלה את העמודות: רוחב הקבוצה )

(d.)ב. מחשבים. חישוב צפיפות:.Y ו Xג. בונים מערכת צירים של

) ע"י X נציג את הערכים של המשתנה הנחקר ( Xד. על ציר ה- קטעים לפי רוחב

נציג את הצפיפות.Yהקבוצה. ועל ציר ה ה. קנה המידה לשרטוט המלבן נקבע לפי רוחב הקבוצה וגובהו

יהיה עד לצפיפות הקבוצה.

Page 16: מבוא לסטטיסטיקה א

מצולע שכיחויות

מצולע השכיחויות מתאר את המהלך •הכללי של התפלגות המשתנה הנחקר.

לאחר שציירנו את ההיסטוגרמה אנו מסמנים נקודה באמצע של כל בסיס

מצב משפחתיומחברים באמצעות קווים ישרים. מס' העולים

0-14 2,787

15-24 2,870

25-44 3,999

45-74 3,453

75-80 590

סה"כ 13,699

Page 17: מבוא לסטטיסטיקה א

סוגי התפלגויות

יכולות לצאת שלוש סוגי התפלגויות:•התפלגות סימטרית חד שיאית:.1

*קיים ריכוז של המקרים על ערכים בינוניים של המשתנה.

*הצפיפות פוחתת בשני הכיוונים בצורה סימטרית ככל שמתקרבים לקצוות.

התפלגות סימטרית

Page 18: מבוא לסטטיסטיקה א

סוגי התפלגויות

התפלגות א-סיטמטרית חיובית:. 2קיים ריכוז של המקרים על ערכים נמוכים של •

המשתנה.זנב ההתפלגות לכיוון הערכים הגבוהים.•

התפלגות א-סימטרית חיוביתזנב ימינה.

Page 19: מבוא לסטטיסטיקה א

סוגי התפלגויות

התפלגות א-סימטרית שלילית )זנב שמאל(:•קיים ריכוז של המקרים על ערכים גבוהים של •

המשתנה.זנב ההתפלגות לכיוון הערכים הנמוכים.•

התפלגות א- סימטריתשלילית, זנב שמאלי

Page 20: מבוא לסטטיסטיקה א

ערכים מרכזיים

ערך מרכזי הוא ערך יחיד המסכם ומבליט •תכונות מיוחדות של ההתפלגות.

ערכים מרכזיים מתייחיסים למיקום •התופעה.

אנו נדון בשלושה ערכים מרכזיים •מקובלים:

שכיח•חציון•ממוצע•

Page 21: מבוא לסטטיסטיקה א

שכיח

- הוא ערך של משתנה הנחקר בעל MO שכיח•התדירות הגבוהה ביותר. ערך המשתנה הנפוץ ביותר!

את השכיח ניתן לחשב למשתנה מרמת המדידה •הנמוכה ביותר- ממשתנה נומניאלי ולכן ניתן גם לחשב

אותו לכל משתנה ברמת מדידה גבוהה יותר.משתנה זה קל לחישוב ומשמעותו ברורה. )יתרון(.•לא תמיד קיים שכיח ולעיתים יש יותר משכיח אחד.•שכיח אינו מושפע מערכים קיצוניים•

Page 22: מבוא לסטטיסטיקה א

חישוב השכיח

שימו ! •חשוב להבחין מה סוג המשתנה שלפנינו- לכל

משתנה יש שיטת חישוב שונה!סדרת ערכים בודדים:. 1 השכיח הוא המספר המופיע הכי הרבה •

פעמים: 29,17,12,15,12,13,12

Page 23: מבוא לסטטיסטיקה א

חישוב השכיח

. משתנה בדיד או רציף עם קבוצות 2בעלות אותו רוחב:

יש להסתכל על עמודת השכיחות.•( הוא בעל השכיחות הגבוהה Xהשכיח )•

ביותר.מספר נפשות במשק הבית

משקי בית באלפים

1 50.0

2 96.9

3 78.1

4 56.9

5+ 33.0

סה"כ 314.9

מצב משפחתי מספר העולים

רווק/ה 3,638

נשוי/אה 5,539

גרוש/ה 992

אלמן/ה 741

לא ידוע 2

סה"כ 10,912

Page 24: מבוא לסטטיסטיקה א

חישוב השכיח

. למשתנה רציף בקבוצות בעלות רוחב 3קבוצה שונה:

בונים עמודה של רוחב קבוצה )*** לשים לב לסגירת •הקבוצה!!! (

(:dמחשבים צפיפות )• היא בעלת הצפיפות הגבוהה ביותר. הקבוצה השכיחה•

הגיל סטודנטים רוחב קבוצה

צפיפות (d)

18-19 3,839

20-21 11,441

22-24 33,272

25-29 23,729

30-34 3,147

35-40 2,819

סה"כ 78,247

Page 25: מבוא לסטטיסטיקה א

Meחציון

החציון הוא ערך של המשתנה הנחקר שמחצית המקרים •קטנים ממנו או שווים לו, מחצית המקרים גדולים ממנו או

שווים לו.החציון הוא ערך אמצעי בהתפלגות.•את החציון ניתן לחשב למשתנה ברמה אורדינאלית, •

אינטרוולית ויחס.כדי לחשב חציון חייבים לסדר את הערכים מהנמוך לגבוה.•החציון מושפע מסדר הערכים ולא מהערכים עצמם, •

כל עוד מתקיים, פרט לערך האמצעי שקובע את החציון. שהערכים הקטנים מהחציון, אף אם הם ישתנו, ישארו קטנים

ממנו, ואילו הערכים שגדולים מהחציון, אף אם הם ישתנו, יהיו גדולים ממנו- החציון לא ישתנה.

החציון לא מושפע מערכים קיצוניים.•

Page 26: מבוא לסטטיסטיקה א

חישוב חציון

חישוב חציון בסדרת ערכים בודדים כאשר מס' •ערכים אי זוגי:

. יש לסדר תחילה את הערכים מהערך הנמוך ביותר 1לערך הגבוה.

. כאשר מס' הערכים הוא אי זוגי החציון ימוקם ב:2n+)1) מס הערכים

2 גברים:9דוגמא א': להלן נתונים על גובה של

מס' סידורי

1 2 3 4 5 6 7 8 9

גובה 166 172 172 175 178 179 180 184 187

Page 27: מבוא לסטטיסטיקה א

חישוב החציון

חישוב חציון בסדרת ערכים בודדים כאשר מס' •ערכים זוגי:

. יש לסדר תחילה את הערכים מהערך הנמוך ביותר 1לערך הגבוה.

. כאשר מס' הערכים הוא זוגי החציון ימוקם בין:2מס' הערכים לבין: מס' הערכים

+2 2

2 גברים:9דוגמא ב': להלן נתונים על גובה

מס' סידורי

1 2 3 4 5 6 7 8

גובה 166 172 172 175 178 179 180 184

Page 28: מבוא לסטטיסטיקה א

חישוב חציון

חישוב חציון למשתנה בדיד:•יש לבנות לוח שכיחות מצטברת באחוזים.1. 50%הערך החציוני הוא זה שעד אליו מתפלגים 2.

מספר מהמקרים.נפשות במשק הבית

משקי בית באלפים

Fשכיחות מצטברת

שכיחות מצטברת באחוזים

1 50.0

2 96.9

3 78.1

4 56.9

5+ 33.0

סה"כ 314.9

Page 29: מבוא לסטטיסטיקה א

חישוב החציון

חישוב חציון למשתנה רציף:•.יש לבנות לוח שכיחות יחסית מצטברת ב%.1 50%. הקבוצה החציונית היא זו שעד איליה מתפלגים 2

מהמקרים.. לאותה קבוצה נמצא את רוחב הקבוצה. 3. יש להציב את הערכים בנוסחא:4

הגיל מספר העולים

(l)רוחב קבוצה

(( Fשכיחות מצטבר

ת

0-14 2,787

15-24

2,870

25-44

3,999

45-74

3,453

75-80

590

סה"כ 13,699

Page 30: מבוא לסטטיסטיקה א

Meanממוצע

הממוצע הינו הסכום של כל ערכי המשתנה •חלקי מספר הנחקרים.

ניתן לחשב ממוצע מרמה אינטרוולית ומעלה.•הממוצע מתאר רמה כללית של התופעה והוא •

לא בהכרח ערך קיים בסדרה הסטטיסטית.הממוצע מושפע מערכים קיצוניים )חיסרון(•סכום ההפרשים של ערכי הסדרה •

.0הסטטיסטית, ממוצעם תמיד יהיה שווה ל-זאת מאחר, שסך ההפרשים החיוביים מתקזזים

עם השליליים.

Page 31: מבוא לסטטיסטיקה א

תכונות הממוצע

Page 32: מבוא לסטטיסטיקה א

חישוב הממוצע

חישוב ממוצע בסדרת ערכים בודדים: •סוכמים את כל הערכים חלקי מס' הערכים.

חישוב ממוצע למשתנה בדיד:•

יש לחשב אמצע חישוב ממוצע למשתנה רציף:•קטע לכל קבוצה והם נהפכים להיות .

משתמשים באותה נוסחא כמו של משתנה בדיד.גבול עליון+גבול תחתוןחישוב אמצע קטע:

2יש לשים לב לרווח הקבוצה.

Page 33: מבוא לסטטיסטיקה א

שאלות ממבחנים

בטבלה מתוארים מס' כוסות הקפה •שמרצים במכללה שותים במהלך החודש:מס'

כוסות הקפה

מס' המרצים

0-10 25

11-20 70

21-40 65

41-80 40

81-100 50

סה"כ 250

Page 34: מבוא לסטטיסטיקה א

שאלות ממבחנים

א. החציון של מס' כוסות הקפה הוא?ב. מס' כוסות הקפה הממוצע הוא?

ג. קבוצת השכיח היא?ד. לאחר בדיקה חוזרת של הנתונים, התברר כי חלה טעות

81-120ברישום והקבוצה האחרונה צריכה להיות . אין שינויים בנתונים אחרים.81-100במקום

כיצד ישפיע השינוי על המדדים בלי לחשביש להסביר הבאים:

חציון: יגדל/יקטן/לא ישתנה1.

ממוצע: יגדל/יקטן/לא ישתנה2.

שכיח: יגדל/יקטן/לא ישתנה3.

Page 35: מבוא לסטטיסטיקה א

שאלות ממבחנים

סטודנטים נבחנו בקורס מבוא לכלכלה 61 , חציון 70והתקבלו התוצאות הבאות: ממוצע

74. סטודנטים אשר ציוניהם: 3לקבוצה זו נוספו עוד 65 , 70 , 73.

הציונים:64לכל א. הממוצע יגדל נכון / לא נכון

ב. החציון יגדל נכון/ לא נכון

Page 36: מבוא לסטטיסטיקה א

שאלות ממבחנים

יילודים נמצא כי 100במדגם של •התפלגות הילודים לפי משקל היא

3200סימטרית. המשקל החציוני הוא גרם. נוספו למדגם עוד שני ילודים:

גרם.300 גרם ובמשקל 3900במשקל הילודים- המשקל הממוצע 102עבור כל •

יגדל והמשקל החציוני לא ישתנה.נכון / לא נכון

Page 37: מבוא לסטטיסטיקה א

שאלה נוספת

Page 38: מבוא לסטטיסטיקה א

הקשר בין סדר הערכים המרכזיים לצורת ההתפלגות

כל הערכים נמצאים על אותה נקודה במרכז •ההתפלגות.

כלומר, ריכוז המקרים הוא באמצע •ההתפלגות ושאר הערכים מפוזרים באופן

שווה בקצוות ההתפלגות.

Page 39: מבוא לסטטיסטיקה א

הקשר בין סדר הערכים המרכזיים לצורת ההתפלגות

קיים ריכוז של מקרים בערכים הנמוכים •של המשתנה וזנב ההתפלגות מתמשך

לצד ימין לכיוון הערכים הגבוהים.

Page 40: מבוא לסטטיסטיקה א

הקשר בין סדר הערכים המרכזיים לצורת ההתפלגות

קיים ריכוז של מקרים בערכים הגבוהים •של המשתנה וזנב ההתפלגות מתמשך

לצד שמאל לכיוון הערכים הגבוהים.

Page 41: מבוא לסטטיסטיקה א

שאלות ממבחנים

במפעל מסוים ידוע כי התפלגות העובדים לפי שנות הוותק שלהם היא אסימטרית

חיובית, לכן ברור כי אחוז העובדים בעלי הוותק הנמוך מהוותק השכיח במפעל הינו

גדול יותר מאחוז העובדים בעלי הוותקהגבוה מהוותק השכיח במפעל.

נכון/לא נכון.

Page 42: מבוא לסטטיסטיקה א

שאלה

Page 43: מבוא לסטטיסטיקה א

מדדי פיזור

תיאור סדרה סטטיסטית ע"י ערכים מרכזיים הוא •לא תיאור שלם.

על מנת ללמוד יותר על התפלגות ערכי •המשתנה יש לתאר גם את הפיזור שלהם ע"י

מדדי הפיזור.מדדי הפיזור בהם נתון:•

תחום/טווח.1.

תחום בין רביעוני.2.

שונות.3.

סטיית תקן.4.

Page 44: מבוא לסטטיסטיקה א

Rהתחום

התחום הינו ההפרש בין התצפית הגדולה •ביותר בסדרה הסטטיסטית לבין התצפית

הקטנה ביותר. התחום מתאים למשתנה אינטרוואלי ויחס.•

Page 45: מבוא לסטטיסטיקה א

חישוב במשתנים

9,8,7,6,5 סדרת ערכים בודדים:• זה מעיד על כך שאין פיזור ולא R=0כאשר •

7,7,7,7,7קיימים הבדלים בין הערכים: משתנה משתנה בדיד:

מספר נפשות : רציףבמשק הבית

משקי בית באלפים

1 50.0

2 96.9

3 78.1

4 56.9

5+ 33.0

סה"כ 314.9

הגיל מספר העולים

0-14 2,787

15-24 2,870

25-44 3,999

45-74 3,453

75-80 590

סה"כ 13,699

Page 46: מבוא לסטטיסטיקה א

דוגמא:

סטודנטים נבחנו בסטטיסטיקה.40כיתה של .100, סטודנט אחר קיבל 0סטודנט אחד קיבל

.80 האחרים קיבלו 38כל ה-

(?Rמהו התחום? )

Page 47: מבוא לסטטיסטיקה א

Rתכונות התחום

התחום קל לחישוב ובעל משמעות ברורה.•התחום מושפע מערכים קיצוניים.•התחום מתבסס רק על קצוות ההתפלגות •

ולא מבטא את הערכים בפיזור של הסדר הסטטיסטית.

החיסרון שלו בולט כאשר מתקיימים מקרים •קיצוניים מאחר והם קובעים את אמת הפיזור.)התמונה הכללית עלולה להיות מושפעת מכך(.

Page 48: מבוא לסטטיסטיקה א

IQRהתחום הבין רביעוני

התחום הבין רביעוני הוא ההפרש בין הרביעון •העליון )השלישי( לבין הרביעון התחתון )הראשון(.

התחום הבין רביעוני מתאים למשתנה אורדינאלי •ולכן גם יחס ואינטרוולי.

על התחום הבין רביעוני מרוכזים מחתית המקרים •שבמרכז ההתפלגות והוא לא מושפע מהמקרים

שבקצוות ההתפלגות.הוא מושפע מסדר הערכים ונקבע רק לפי •

N/4, 3N/4הערכים הנמצאים במקומות הסדורים

Page 49: מבוא לסטטיסטיקה א

מהם הם הרבעונים?

Page 50: מבוא לסטטיסטיקה א

חישוב רביעונים למשתנה בדיד:

יש לבנות לוח שכיחות יחסית מצטברת באחוזים.•Q1 מהמקרים.25%- הוא הערך שעד אליו- כולל, מתפלגים Q3 מהמקרים.75%- הוא הערך שעד אליו- כולל, מתפלגים

מציאת התחום הבין רביעוני•

מס' שביתות מפעלים

0 218

1 90

2 70

3 49

4 36

5 23

6 14

סה"כ 500

Page 51: מבוא לסטטיסטיקה א

חישוב רביעוני למשתנה רציף:

Page 52: מבוא לסטטיסטיקה א

שאלות ממבחנים

Page 53: מבוא לסטטיסטיקה א

הקשר בין רביעונים וצורת ההתפלגות

Page 54: מבוא לסטטיסטיקה א

הקשר בין רביעונים וצורת ההתפלגות

Page 55: מבוא לסטטיסטיקה א

שאלות ממבחנים

Page 56: מבוא לסטטיסטיקה א

ערכי חלוקה

Page 57: מבוא לסטטיסטיקה א

ערכי חלוקה

3Nלדוגמא: העשירון השלישי: • 10

Page 58: מבוא לסטטיסטיקה א

שונות וסטיית תקן

Page 59: מבוא לסטטיסטיקה א

חישוב שונות וסטיית תקן

חישוב ס.תקן בסדרת ערכים בודדים:•נוסחא רגילה:•נוסחא חישובית:•חישוב ס.תקן למשתנה בדיד:•נוסחא רגילה:•נוסחא חישובית:•אצל משתנה רציף צריך לחשב אמצע קטע •

Xiולהציב אותו במקום ה

Page 60: מבוא לסטטיסטיקה א
Page 61: מבוא לסטטיסטיקה א
Page 62: מבוא לסטטיסטיקה א
Page 63: מבוא לסטטיסטיקה א

השפעות טרנספורמציה על שונותוהממוצע

ממוצע:חיבור וחיסור משפיעים על הממוצע. הממוצע יגדל/ יקטן •

באותו קבוע.כפל וחילוק משפיעים על הממוצע. הממוצע יגדל /יקטן פי •

אותו קבוע.שונות:

לפעולות של חיבור וחיסור אין השפעה על השונות וס. •התקן.

הפיזור לא משתנה יש רק הזזה!•בכפל וחילוק קיימת השפעה. השונות תגדל/ תקטן פי •

הקבוע שהכפלנו בריבוע, וס.התקן תגדל/ תקטן פי הקבוע.

Page 64: מבוא לסטטיסטיקה א

שאלות ממבחנים

עובדים.1000במפעל מועסקים • .4,400₪הרביעון הראשון של השכר הוא • .9,800₪העשירות התשיעי של השכר הוא • ₪ מכל אחד 500בעל המפעל החליט להפחית •

500 ₪ ולהוסיף 9,800מהעובדים המשתכרים מעל .₪4,400₪ לכל אחד מהעובדים המשתכרים ל-

לאחר השינויים בשכר- השכר הממוצע יקטן וגם ס.•התקן של המשכורת תקטן.

נכון/ לא נכון.

Page 65: מבוא לסטטיסטיקה א

שאלות ממבחנים

השכר הממוצע של עובד מפעל מסוים הוא •. בגלל בעיות 2000₪ ₪, עם ס.תקן של 6000

10%כלכליות החליט בעל המפעל לצמצם ב- את שכרו שלכל עובד. בשלב מאוחר יותר

₪ משכרו 200החליט בעל המפעל להפחית של כל עובד.

אחרי שני השינויים בשכר - השכר הממוצע יהיה • .1,600₪ וסטיית התקן של השכר 5,200₪

נכון/ לא נכון.

Page 66: מבוא לסטטיסטיקה א

V.Cמקדם השתנות

זהו מדד לפיזור יחסי של כלל התצפיות, יחסית לממוצע.ככל שהפיזור קטן יותר - מדובר על מקדם הומוגני ולכן •

הוא גם אמין יותר. קבוצות והחוקרים שואלים על 2אם לצורך העניין יש •

איזה קבוצה כדאי להם לעשות את המחקר -על הקבוצה ההומוגנית יותר.

למה משתמשים ב %? בעזרתם ניתן להשוות בין •קבוצות שונות או יחידות שונות כמו: משקל, גובה וכו'.

כאשר מדובר על אותו משתנה בעל ממוצעים שונים לא •’.CVכדאי להסתמך על ס.התקן. מומלץ להשתמש ב

Page 67: מבוא לסטטיסטיקה א

דוגמא

Page 68: מבוא לסטטיסטיקה א

ציון תקן

ציון תקן מתאר מיקום יחסי של תצפית מסוימת בסדרה •הסטטיסטית אליה היא שייכת ביחידות של ס.תקן.

נשתמש בו כאשר נהיה מעוניינים לדעת את מיקומה •היחסי של תצפית בודדת בהשוואה לכלל התצפיות.

Zבמקרה ובו שואלים על מיקום יחסי בד"כ מי שיש לו •גדול יותר נמצא במיקום טוב יותר.

Zבמקרה ובו שואלים על חריגות יש להסתכל על •בערך מוחלט.

כלומר במקרה זה אנחנו מסתכלים על המרחק של הציון הבודד מהממוצע.

Page 69: מבוא לסטטיסטיקה א

דוגמא

Page 70: מבוא לסטטיסטיקה א

תכונות ציון התקן

Page 71: מבוא לסטטיסטיקה א

שאלות ממבחנים

עובדים במפעל אלומיניום:41לפניך טבלת הגילאים של •

א. מהו הגיל הממוצע וס. התקן

של העובדים במפעל? ב. מה הוא הרביעון

התחתון של גיל העובדים?

חשבו את מקדם המתאם והסבירו בקצרה את משמעותו.

קבוצת גיל מס' עובדים

20-24 3

25-29 7

30-34 13

35-39 8

40-49 10

Page 72: מבוא לסטטיסטיקה א

שאלות ממבחנים

. 82ממוצע הציונים בבגרות בביולוגיה הוא . 86חביבה קיבלה בבגרות בביולוגיה ציון

מכאן ניתן להסיק כי חביבה הצליחה מאוד במבחן הבגרות בביולוגיה יחסית לחבריה.

נכון / לא נכון.

Page 73: מבוא לסטטיסטיקה א

שאלות ממבחנים

בחברת ההשקעות "חברה בטוחה" ידוע כי מס' • כמו כן ידוע כי השכר 200העובדים בחברה הוא

.3000 וס.התקן היא 12,000הממוצע הוא עקב המשבר האחרון בשוק ההון הוחלט להוריד שכר

. 15%לכל המועסקים בשיעור של .1.2ידוע כי ציון התקן של אתי לפני הורדת השכר היה

מכאן נובע כי:. 15%ציון התקן החדש של אתי יקטן ב-

נכון / לא נכון

Page 74: מבוא לסטטיסטיקה א

קשר סטטיסטי בין משתנים

עד עכשיו עסקנו בתיאור נתונים לפי משתנה אחד.רוב החוקרים מעוניינים לחקור מספר משתנים על •

אותה אוכ', כאשר אחת השאלות שמעניינות אותם הם האם קיים קשר בין המשתנים האלה.

מהי משמעות המושג קשר סטטיסטי? הכוונה היא •ששינו בערך אחד של המשתנה גורר אחריו שינוי של

במשתנה השני. )ככל שההשכלה עולה כך השכר עולה(.

המסקנה: אם נמצא קשר בין המשתנים ניתן "לנבא" •( על סמך ידיעת הערך Xאת הערך של משתנה אחד )

(.Yשל המשתנה השני )

Page 75: מבוא לסטטיסטיקה א

קשר ליניארי בין משתנים

קשר לינארי נמדד במשתנים כמותיים.•נהוג לתאר אותו בדיאגרמת פיזור.•

Page 76: מבוא לסטטיסטיקה א

מקדם המתאם

: rמסומן כ-•

Page 77: מבוא לסטטיסטיקה א

מקדם המתאם

Page 78: מבוא לסטטיסטיקה א

)COV )X,Yמשמעות

.Y ו Xמהווה את השונות המשותפת של • המשתנים קיים יחס ישר 2כלומר אם בין •

משמע –שני המשתנים מתפתחים באותו כיוון ו cov )x,y(.יהיה בעל סימן חיובי

כאשר קיים יחס הפוך בין המשתנים תקבל •השונות המשותפת סימן של שלילי.

נקבע עפ"י השונות rהערה: הסימון של •המשותפת.

Page 79: מבוא לסטטיסטיקה א

תכונות מקדם המתאם

Page 80: מבוא לסטטיסטיקה א

תכונות מקדם המתאם

לא קיים קשר לינאריr=0כאשר •

Page 81: מבוא לסטטיסטיקה א

באמצעות Yקו הרגרסיה לניבוי X:

משתנים מאפשר מציאת 2קיום קשר לינארי בין •קו ישר לעריכת תחזית ממשתנה אחד לשני.

החוקר מעוניין במחקר למצוא חוקיות בהתפתחות •התופעה לפיה יהיה ניתן לערוך את התחזית.

- משתנה התלויYנגדיר

- המשתנה הבלתי תלויXנגדיר

קווי התחזית נקראים קווי רגרסיה.•

Page 82: מבוא לסטטיסטיקה א

משוואת קו ישר

Page 83: מבוא לסטטיסטיקה א

קריטריון הריבועים הפוחתים

Page 84: מבוא לסטטיסטיקה א

נוסחאות קו הרגרסיה

Page 85: מבוא לסטטיסטיקה א

תכונות קו הרגרסיה

גדול יותר הקו הישר יהיה bככל שערכו של •תלול יותר.

Page 86: מבוא לסטטיסטיקה א

Y לפי Xקו רגרסיה לניבוי

Page 87: מבוא לסטטיסטיקה א

נוסחאות קו הרגרסיה

Page 88: מבוא לסטטיסטיקה א

הקשר בין מקדמי המתאם לקוויהרגרסיה

Page 89: מבוא לסטטיסטיקה א

שאלות ממבחנים

Page 90: מבוא לסטטיסטיקה א

שאלות ממבחנים

Page 91: מבוא לסטטיסטיקה א

שאלות ממבחנים

מרצה בדק קשר לנארי בין שני משתנים. •לאחר החישובים חלק מהחומר אבד ונשארו

בידיו התוצאות הבאות:•Cov)x,y(=3 6.2 9 ס. תקן

X=4של לפי נתונים אלו ניתן לחשב את קו הרגרסיה •

.X לפי Yלניבוי נכון / לא נכון.

Page 92: מבוא לסטטיסטיקה א

בהצלחה!!!