מבוא לסטטיסטיקה א

Preview:

DESCRIPTION

מבוא לסטטיסטיקה א'. מגל לס magalless@gmail.com 054-5793060. אז למה לי סטטיסטיקה עכשיו?. כל מחקר שמבוסס על נתונים אמפיריים דורש ידע בסטטיסטיקה , על מנת שנוכל לארגן את הנתונים, לנתח ולהסיק מהם מסקנות . בסמסטר א', אנו מתמקדים בסטטיסטיקה תיאורית. סטטיסטיקה תיאורית. - PowerPoint PPT Presentation

Citation preview

מבוא לסטטיסטיקה א'

מגל לסmagalless@gmail.com

054-5793060

אז למה לי סטטיסטיקה עכשיו?

כל מחקר שמבוסס על נתונים אמפיריים דורש •ידע בסטטיסטיקה, על מנת שנוכל לארגן את

הנתונים, לנתח ולהסיק מהם מסקנות.בסמסטר א', אנו מתמקדים בסטטיסטיקה •

תיאורית.

סטטיסטיקה תיאורית

סטטיסטיקה תיאורית עוסקת בשיטות •לארגון, ותמצות הנתונים

שנאספו במחקר הסטטיסטי.•הנושאים בהם נתמקד:•

. מיון משתנים לפי מהות.1. מיון משתנים לפי רמת המדידה.2. הצגת נתונים ע"י טבלת שכיחויות 3

וגרפים.

מיון משתנים על פי מהות

משתנה

כמותי

רציף בדיד

נומינאלי

מיון משתנים על פי מהות

משתנה איכותי- ערכי המשתנה נבחנים •לפי סוג איכותי ללא ביטוי במספרים.

!מיליםמשמע- לדוגמא: מין, מצב משפחתי.

משתנה כמותי- ערכי המשתנה מציינים •מספרים.כמות. הקטגוריות הן

לדוגמא: גיל, שכר, ותק, מספר ילדים.

מיון משתנים על פי מהות

כמותי בדיד- ערכי משתנים בדידים.• בין כל שני ערכים של המשתנה, קיים

מספרסופי של ערכים ובין שני ערכים קבועים מתקיימת קפיצה.

למשל: מס' ילדים, מספר איחורים, מס' חדרים.

אין חצי ילד, אין חצי איחור אמנם יש כיום חצי חדר אבל גם קפיצה זו היא

מדידה.

הבדל בין כמותי בדיד לבין רציף

כמותי בדיד •

כמותי רציף•

מיון משתנים לפי רמת מדידה

משתנה נומינאלי )שמי(- ערכי המשתנה נבחנים •אין משמעות לסדר שבין לפי שמות/סוגים, כאשר

. )לדוג': מין, מצב משפחתי, מס' טלפון( הערכיםניתן רק להבחין בין שני המשתנים. מי שזכר הוא

a=bלא נקבה. משתנה אורדינאלי )סדר(- יש חשיבות לסדר, ניתן •

לסדר את הערכים מהנמוך לגבוה. )דרגות משתנה זה יכול להופיע גם כאיכותי וגם בצבא(.

3, סמל-2, רב"ט-1כמותי: טוראי- ככמותי: a>b, a=b

איכותי: כלל לא מרוצה, מרוצה, מרוצה מאוד.

מיון משתנים לפי רמת המדידהערכי המשתנה במספרים, יש - משתנה אנטרוואלי )רווח( •

משמעות למרווחים שבין הערכים, ניתן לחשב את ההפרשים אפס מוחלט לא מעיד על העדר ביניהם. לא קיים אפס מוחלט!

)בד"כ מדובר על משתנים שהומצאו ע"י בני האדם -התופעה!כמו: טמפ', ציון פסיכומטרי(.

ערכי המשתנה במספרים, קיים ערך אפס משתנה יחס )מנה(- •מוחלט, ניתן לחלק ערך אחד בשני ולציין מה היחס ביניהם.

)כמו - משקל, גובה וגיל(.

משתנה נומינאלי הוא ברמת המדידה הנמוכה ביותר.•וכולל את משתנה יחס הוא בעל רמת המדידה הגבוהה ביותר •

כל התכונות של קודמיו!

1שאלה

רשמו לגבי כל אחד מהמשתנים את סוגו:•א. איכותי, כמותי-בדיד, כמותי- רציף.

ב. נומינאלי, אורדינלי, אינטרוולי, יחס.

משקל המרצים בחוג לסטטיסטיקה.1.

צבע החולצות של הבנים בכתה.2.

מספרי הטלפון של המרצים במכללה.3.

ארץ מוצאם של פועלים במפעל.4.

הזמן שלוקח לכל אחד מהסטודנטים לפתור תרגיל זה.5.

גובהו של מועמד לקורס קצונה.6.

קווי האוטובוסים הנוסעים ברחוב הרצל.7.

)ממבחן(2שאלה

בסקר שנערך ע"י "מכון לשאלות לא חשובות" •התבקשו הנשאלים לענות על שמונה שאלות. להלן

אחת השאלות מתוך סקר זה: ₪ לחודש.5000 המשכורת הממוצעת בישראל הינה

המשכרות שלך הינה )בשקלים חדשים(:•1 )1 - 2499. •2 )2500 - 4999. •3 )5000 -7500. .7000( מעל 4•ברור שהמשתנה הנבחן )לגביו המכון שואל את •

השאלה( הינו משתנה איכותי – יחס. נכון / לא נכון.

הצגת נתונים בטבלת שכיחויות

חלקי הסה"כ.X: חישוב ערך חישוב שכיחות יחסית•F)X(

N.100: הנ"ל כפול חישוב שכיחות יחסית מצטברת באחוזים•

F)X( *100 N

מדובר על שכיחות חישוב שכיחות יחסית מצטברת באחוזים %: •יחסית הכוללת שהתקבלה, הקטנה או שווה לערך הנתון.

מחברים את התוצאות עד לאותו ערך כולל.•

הצגה גרפית

דרך נוחה וברורה להבלטת התופעה הנחקרת.•בסטטיסטיקה תיאורית קיימות שלוש הצגות גראפיות בהתאם •

לסוג המשתנה:מתאימה : דיאגרמת מעגל1.

למשתנה איכותי נומינאלי.כיצד בונים דיאגרמת מעגל?

א. מחשבים שכיחות יחסית לכל משתנה.

ב. משרטטים מעגל ומחלקים את השטח שלו לגזרות.

ג. יש להקפיד ששטחה של כל גזרה תהיה פרופורציונאלית לשכיחות המקרים.

מצב משפחתי מס' העולים

רווק/ה 3,638

נשוי/אה 5,539

גרוש/ה 992

אלמן/ה 741

לא ידוע 2

סה"כ 10,912

הצגה גרפית

מתאימה לתיאור משתנה : דיאגרמת מקלות. 2איכותי אורדניאלי.ומשתנה כמותי בדיד

כיצד בונים דיאגרמת מקלות? Xא. בונים מערכת צירים של

.Y ו- נציג את הערכים Xב. על ציר ה-

( Xשל המשתנה הנחקר )(.F נציג את השכיחות )Yועל ציר ה-

נציב מקל באורך Xג. מעל כל ערך של משתנה פרופורציונאלי לשכיחות המקרים.

שביעות הרצון מספר סטודנטים

לא רוצים 1

נמוכה 3

בינונית 2

טובה 4

טובה מאוד 2

סה"כ 12

הצגה גרפית

הצגה גרפית זו מתאימה היסטוגרמה )דיאגראמת מלבנים(:. 3למשתנה כמותי רציף, אינטרוואלי או יחס.

כיצד בונים דיאגראמת מלבנים? ( וצפיפות 1א. מצרפים לטבלה את העמודות: רוחב הקבוצה )

(d.)ב. מחשבים. חישוב צפיפות:.Y ו Xג. בונים מערכת צירים של

) ע"י X נציג את הערכים של המשתנה הנחקר ( Xד. על ציר ה- קטעים לפי רוחב

נציג את הצפיפות.Yהקבוצה. ועל ציר ה ה. קנה המידה לשרטוט המלבן נקבע לפי רוחב הקבוצה וגובהו

יהיה עד לצפיפות הקבוצה.

מצולע שכיחויות

מצולע השכיחויות מתאר את המהלך •הכללי של התפלגות המשתנה הנחקר.

לאחר שציירנו את ההיסטוגרמה אנו מסמנים נקודה באמצע של כל בסיס

מצב משפחתיומחברים באמצעות קווים ישרים. מס' העולים

0-14 2,787

15-24 2,870

25-44 3,999

45-74 3,453

75-80 590

סה"כ 13,699

סוגי התפלגויות

יכולות לצאת שלוש סוגי התפלגויות:•התפלגות סימטרית חד שיאית:.1

*קיים ריכוז של המקרים על ערכים בינוניים של המשתנה.

*הצפיפות פוחתת בשני הכיוונים בצורה סימטרית ככל שמתקרבים לקצוות.

התפלגות סימטרית

סוגי התפלגויות

התפלגות א-סיטמטרית חיובית:. 2קיים ריכוז של המקרים על ערכים נמוכים של •

המשתנה.זנב ההתפלגות לכיוון הערכים הגבוהים.•

התפלגות א-סימטרית חיוביתזנב ימינה.

סוגי התפלגויות

התפלגות א-סימטרית שלילית )זנב שמאל(:•קיים ריכוז של המקרים על ערכים גבוהים של •

המשתנה.זנב ההתפלגות לכיוון הערכים הנמוכים.•

התפלגות א- סימטריתשלילית, זנב שמאלי

ערכים מרכזיים

ערך מרכזי הוא ערך יחיד המסכם ומבליט •תכונות מיוחדות של ההתפלגות.

ערכים מרכזיים מתייחיסים למיקום •התופעה.

אנו נדון בשלושה ערכים מרכזיים •מקובלים:

שכיח•חציון•ממוצע•

שכיח

- הוא ערך של משתנה הנחקר בעל MO שכיח•התדירות הגבוהה ביותר. ערך המשתנה הנפוץ ביותר!

את השכיח ניתן לחשב למשתנה מרמת המדידה •הנמוכה ביותר- ממשתנה נומניאלי ולכן ניתן גם לחשב

אותו לכל משתנה ברמת מדידה גבוהה יותר.משתנה זה קל לחישוב ומשמעותו ברורה. )יתרון(.•לא תמיד קיים שכיח ולעיתים יש יותר משכיח אחד.•שכיח אינו מושפע מערכים קיצוניים•

חישוב השכיח

שימו ! •חשוב להבחין מה סוג המשתנה שלפנינו- לכל

משתנה יש שיטת חישוב שונה!סדרת ערכים בודדים:. 1 השכיח הוא המספר המופיע הכי הרבה •

פעמים: 29,17,12,15,12,13,12

חישוב השכיח

. משתנה בדיד או רציף עם קבוצות 2בעלות אותו רוחב:

יש להסתכל על עמודת השכיחות.•( הוא בעל השכיחות הגבוהה Xהשכיח )•

ביותר.מספר נפשות במשק הבית

משקי בית באלפים

1 50.0

2 96.9

3 78.1

4 56.9

5+ 33.0

סה"כ 314.9

מצב משפחתי מספר העולים

רווק/ה 3,638

נשוי/אה 5,539

גרוש/ה 992

אלמן/ה 741

לא ידוע 2

סה"כ 10,912

חישוב השכיח

. למשתנה רציף בקבוצות בעלות רוחב 3קבוצה שונה:

בונים עמודה של רוחב קבוצה )*** לשים לב לסגירת •הקבוצה!!! (

(:dמחשבים צפיפות )• היא בעלת הצפיפות הגבוהה ביותר. הקבוצה השכיחה•

הגיל סטודנטים רוחב קבוצה

צפיפות (d)

18-19 3,839

20-21 11,441

22-24 33,272

25-29 23,729

30-34 3,147

35-40 2,819

סה"כ 78,247

Meחציון

החציון הוא ערך של המשתנה הנחקר שמחצית המקרים •קטנים ממנו או שווים לו, מחצית המקרים גדולים ממנו או

שווים לו.החציון הוא ערך אמצעי בהתפלגות.•את החציון ניתן לחשב למשתנה ברמה אורדינאלית, •

אינטרוולית ויחס.כדי לחשב חציון חייבים לסדר את הערכים מהנמוך לגבוה.•החציון מושפע מסדר הערכים ולא מהערכים עצמם, •

כל עוד מתקיים, פרט לערך האמצעי שקובע את החציון. שהערכים הקטנים מהחציון, אף אם הם ישתנו, ישארו קטנים

ממנו, ואילו הערכים שגדולים מהחציון, אף אם הם ישתנו, יהיו גדולים ממנו- החציון לא ישתנה.

החציון לא מושפע מערכים קיצוניים.•

חישוב חציון

חישוב חציון בסדרת ערכים בודדים כאשר מס' •ערכים אי זוגי:

. יש לסדר תחילה את הערכים מהערך הנמוך ביותר 1לערך הגבוה.

. כאשר מס' הערכים הוא אי זוגי החציון ימוקם ב:2n+)1) מס הערכים

2 גברים:9דוגמא א': להלן נתונים על גובה של

מס' סידורי

1 2 3 4 5 6 7 8 9

גובה 166 172 172 175 178 179 180 184 187

חישוב החציון

חישוב חציון בסדרת ערכים בודדים כאשר מס' •ערכים זוגי:

. יש לסדר תחילה את הערכים מהערך הנמוך ביותר 1לערך הגבוה.

. כאשר מס' הערכים הוא זוגי החציון ימוקם בין:2מס' הערכים לבין: מס' הערכים

+2 2

2 גברים:9דוגמא ב': להלן נתונים על גובה

מס' סידורי

1 2 3 4 5 6 7 8

גובה 166 172 172 175 178 179 180 184

חישוב חציון

חישוב חציון למשתנה בדיד:•יש לבנות לוח שכיחות מצטברת באחוזים.1. 50%הערך החציוני הוא זה שעד אליו מתפלגים 2.

מספר מהמקרים.נפשות במשק הבית

משקי בית באלפים

Fשכיחות מצטברת

שכיחות מצטברת באחוזים

1 50.0

2 96.9

3 78.1

4 56.9

5+ 33.0

סה"כ 314.9

חישוב החציון

חישוב חציון למשתנה רציף:•.יש לבנות לוח שכיחות יחסית מצטברת ב%.1 50%. הקבוצה החציונית היא זו שעד איליה מתפלגים 2

מהמקרים.. לאותה קבוצה נמצא את רוחב הקבוצה. 3. יש להציב את הערכים בנוסחא:4

הגיל מספר העולים

(l)רוחב קבוצה

(( Fשכיחות מצטבר

ת

0-14 2,787

15-24

2,870

25-44

3,999

45-74

3,453

75-80

590

סה"כ 13,699

Meanממוצע

הממוצע הינו הסכום של כל ערכי המשתנה •חלקי מספר הנחקרים.

ניתן לחשב ממוצע מרמה אינטרוולית ומעלה.•הממוצע מתאר רמה כללית של התופעה והוא •

לא בהכרח ערך קיים בסדרה הסטטיסטית.הממוצע מושפע מערכים קיצוניים )חיסרון(•סכום ההפרשים של ערכי הסדרה •

.0הסטטיסטית, ממוצעם תמיד יהיה שווה ל-זאת מאחר, שסך ההפרשים החיוביים מתקזזים

עם השליליים.

תכונות הממוצע

חישוב הממוצע

חישוב ממוצע בסדרת ערכים בודדים: •סוכמים את כל הערכים חלקי מס' הערכים.

חישוב ממוצע למשתנה בדיד:•

יש לחשב אמצע חישוב ממוצע למשתנה רציף:•קטע לכל קבוצה והם נהפכים להיות .

משתמשים באותה נוסחא כמו של משתנה בדיד.גבול עליון+גבול תחתוןחישוב אמצע קטע:

2יש לשים לב לרווח הקבוצה.

שאלות ממבחנים

בטבלה מתוארים מס' כוסות הקפה •שמרצים במכללה שותים במהלך החודש:מס'

כוסות הקפה

מס' המרצים

0-10 25

11-20 70

21-40 65

41-80 40

81-100 50

סה"כ 250

שאלות ממבחנים

א. החציון של מס' כוסות הקפה הוא?ב. מס' כוסות הקפה הממוצע הוא?

ג. קבוצת השכיח היא?ד. לאחר בדיקה חוזרת של הנתונים, התברר כי חלה טעות

81-120ברישום והקבוצה האחרונה צריכה להיות . אין שינויים בנתונים אחרים.81-100במקום

כיצד ישפיע השינוי על המדדים בלי לחשביש להסביר הבאים:

חציון: יגדל/יקטן/לא ישתנה1.

ממוצע: יגדל/יקטן/לא ישתנה2.

שכיח: יגדל/יקטן/לא ישתנה3.

שאלות ממבחנים

סטודנטים נבחנו בקורס מבוא לכלכלה 61 , חציון 70והתקבלו התוצאות הבאות: ממוצע

74. סטודנטים אשר ציוניהם: 3לקבוצה זו נוספו עוד 65 , 70 , 73.

הציונים:64לכל א. הממוצע יגדל נכון / לא נכון

ב. החציון יגדל נכון/ לא נכון

שאלות ממבחנים

יילודים נמצא כי 100במדגם של •התפלגות הילודים לפי משקל היא

3200סימטרית. המשקל החציוני הוא גרם. נוספו למדגם עוד שני ילודים:

גרם.300 גרם ובמשקל 3900במשקל הילודים- המשקל הממוצע 102עבור כל •

יגדל והמשקל החציוני לא ישתנה.נכון / לא נכון

שאלה נוספת

הקשר בין סדר הערכים המרכזיים לצורת ההתפלגות

כל הערכים נמצאים על אותה נקודה במרכז •ההתפלגות.

כלומר, ריכוז המקרים הוא באמצע •ההתפלגות ושאר הערכים מפוזרים באופן

שווה בקצוות ההתפלגות.

הקשר בין סדר הערכים המרכזיים לצורת ההתפלגות

קיים ריכוז של מקרים בערכים הנמוכים •של המשתנה וזנב ההתפלגות מתמשך

לצד ימין לכיוון הערכים הגבוהים.

הקשר בין סדר הערכים המרכזיים לצורת ההתפלגות

קיים ריכוז של מקרים בערכים הגבוהים •של המשתנה וזנב ההתפלגות מתמשך

לצד שמאל לכיוון הערכים הגבוהים.

שאלות ממבחנים

במפעל מסוים ידוע כי התפלגות העובדים לפי שנות הוותק שלהם היא אסימטרית

חיובית, לכן ברור כי אחוז העובדים בעלי הוותק הנמוך מהוותק השכיח במפעל הינו

גדול יותר מאחוז העובדים בעלי הוותקהגבוה מהוותק השכיח במפעל.

נכון/לא נכון.

שאלה

מדדי פיזור

תיאור סדרה סטטיסטית ע"י ערכים מרכזיים הוא •לא תיאור שלם.

על מנת ללמוד יותר על התפלגות ערכי •המשתנה יש לתאר גם את הפיזור שלהם ע"י

מדדי הפיזור.מדדי הפיזור בהם נתון:•

תחום/טווח.1.

תחום בין רביעוני.2.

שונות.3.

סטיית תקן.4.

Rהתחום

התחום הינו ההפרש בין התצפית הגדולה •ביותר בסדרה הסטטיסטית לבין התצפית

הקטנה ביותר. התחום מתאים למשתנה אינטרוואלי ויחס.•

חישוב במשתנים

9,8,7,6,5 סדרת ערכים בודדים:• זה מעיד על כך שאין פיזור ולא R=0כאשר •

7,7,7,7,7קיימים הבדלים בין הערכים: משתנה משתנה בדיד:

מספר נפשות : רציףבמשק הבית

משקי בית באלפים

1 50.0

2 96.9

3 78.1

4 56.9

5+ 33.0

סה"כ 314.9

הגיל מספר העולים

0-14 2,787

15-24 2,870

25-44 3,999

45-74 3,453

75-80 590

סה"כ 13,699

דוגמא:

סטודנטים נבחנו בסטטיסטיקה.40כיתה של .100, סטודנט אחר קיבל 0סטודנט אחד קיבל

.80 האחרים קיבלו 38כל ה-

(?Rמהו התחום? )

Rתכונות התחום

התחום קל לחישוב ובעל משמעות ברורה.•התחום מושפע מערכים קיצוניים.•התחום מתבסס רק על קצוות ההתפלגות •

ולא מבטא את הערכים בפיזור של הסדר הסטטיסטית.

החיסרון שלו בולט כאשר מתקיימים מקרים •קיצוניים מאחר והם קובעים את אמת הפיזור.)התמונה הכללית עלולה להיות מושפעת מכך(.

IQRהתחום הבין רביעוני

התחום הבין רביעוני הוא ההפרש בין הרביעון •העליון )השלישי( לבין הרביעון התחתון )הראשון(.

התחום הבין רביעוני מתאים למשתנה אורדינאלי •ולכן גם יחס ואינטרוולי.

על התחום הבין רביעוני מרוכזים מחתית המקרים •שבמרכז ההתפלגות והוא לא מושפע מהמקרים

שבקצוות ההתפלגות.הוא מושפע מסדר הערכים ונקבע רק לפי •

N/4, 3N/4הערכים הנמצאים במקומות הסדורים

מהם הם הרבעונים?

חישוב רביעונים למשתנה בדיד:

יש לבנות לוח שכיחות יחסית מצטברת באחוזים.•Q1 מהמקרים.25%- הוא הערך שעד אליו- כולל, מתפלגים Q3 מהמקרים.75%- הוא הערך שעד אליו- כולל, מתפלגים

מציאת התחום הבין רביעוני•

מס' שביתות מפעלים

0 218

1 90

2 70

3 49

4 36

5 23

6 14

סה"כ 500

חישוב רביעוני למשתנה רציף:

שאלות ממבחנים

הקשר בין רביעונים וצורת ההתפלגות

הקשר בין רביעונים וצורת ההתפלגות

שאלות ממבחנים

ערכי חלוקה

ערכי חלוקה

3Nלדוגמא: העשירון השלישי: • 10

שונות וסטיית תקן

חישוב שונות וסטיית תקן

חישוב ס.תקן בסדרת ערכים בודדים:•נוסחא רגילה:•נוסחא חישובית:•חישוב ס.תקן למשתנה בדיד:•נוסחא רגילה:•נוסחא חישובית:•אצל משתנה רציף צריך לחשב אמצע קטע •

Xiולהציב אותו במקום ה

השפעות טרנספורמציה על שונותוהממוצע

ממוצע:חיבור וחיסור משפיעים על הממוצע. הממוצע יגדל/ יקטן •

באותו קבוע.כפל וחילוק משפיעים על הממוצע. הממוצע יגדל /יקטן פי •

אותו קבוע.שונות:

לפעולות של חיבור וחיסור אין השפעה על השונות וס. •התקן.

הפיזור לא משתנה יש רק הזזה!•בכפל וחילוק קיימת השפעה. השונות תגדל/ תקטן פי •

הקבוע שהכפלנו בריבוע, וס.התקן תגדל/ תקטן פי הקבוע.

שאלות ממבחנים

עובדים.1000במפעל מועסקים • .4,400₪הרביעון הראשון של השכר הוא • .9,800₪העשירות התשיעי של השכר הוא • ₪ מכל אחד 500בעל המפעל החליט להפחית •

500 ₪ ולהוסיף 9,800מהעובדים המשתכרים מעל .₪4,400₪ לכל אחד מהעובדים המשתכרים ל-

לאחר השינויים בשכר- השכר הממוצע יקטן וגם ס.•התקן של המשכורת תקטן.

נכון/ לא נכון.

שאלות ממבחנים

השכר הממוצע של עובד מפעל מסוים הוא •. בגלל בעיות 2000₪ ₪, עם ס.תקן של 6000

10%כלכליות החליט בעל המפעל לצמצם ב- את שכרו שלכל עובד. בשלב מאוחר יותר

₪ משכרו 200החליט בעל המפעל להפחית של כל עובד.

אחרי שני השינויים בשכר - השכר הממוצע יהיה • .1,600₪ וסטיית התקן של השכר 5,200₪

נכון/ לא נכון.

V.Cמקדם השתנות

זהו מדד לפיזור יחסי של כלל התצפיות, יחסית לממוצע.ככל שהפיזור קטן יותר - מדובר על מקדם הומוגני ולכן •

הוא גם אמין יותר. קבוצות והחוקרים שואלים על 2אם לצורך העניין יש •

איזה קבוצה כדאי להם לעשות את המחקר -על הקבוצה ההומוגנית יותר.

למה משתמשים ב %? בעזרתם ניתן להשוות בין •קבוצות שונות או יחידות שונות כמו: משקל, גובה וכו'.

כאשר מדובר על אותו משתנה בעל ממוצעים שונים לא •’.CVכדאי להסתמך על ס.התקן. מומלץ להשתמש ב

דוגמא

ציון תקן

ציון תקן מתאר מיקום יחסי של תצפית מסוימת בסדרה •הסטטיסטית אליה היא שייכת ביחידות של ס.תקן.

נשתמש בו כאשר נהיה מעוניינים לדעת את מיקומה •היחסי של תצפית בודדת בהשוואה לכלל התצפיות.

Zבמקרה ובו שואלים על מיקום יחסי בד"כ מי שיש לו •גדול יותר נמצא במיקום טוב יותר.

Zבמקרה ובו שואלים על חריגות יש להסתכל על •בערך מוחלט.

כלומר במקרה זה אנחנו מסתכלים על המרחק של הציון הבודד מהממוצע.

דוגמא

תכונות ציון התקן

שאלות ממבחנים

עובדים במפעל אלומיניום:41לפניך טבלת הגילאים של •

א. מהו הגיל הממוצע וס. התקן

של העובדים במפעל? ב. מה הוא הרביעון

התחתון של גיל העובדים?

חשבו את מקדם המתאם והסבירו בקצרה את משמעותו.

קבוצת גיל מס' עובדים

20-24 3

25-29 7

30-34 13

35-39 8

40-49 10

שאלות ממבחנים

. 82ממוצע הציונים בבגרות בביולוגיה הוא . 86חביבה קיבלה בבגרות בביולוגיה ציון

מכאן ניתן להסיק כי חביבה הצליחה מאוד במבחן הבגרות בביולוגיה יחסית לחבריה.

נכון / לא נכון.

שאלות ממבחנים

בחברת ההשקעות "חברה בטוחה" ידוע כי מס' • כמו כן ידוע כי השכר 200העובדים בחברה הוא

.3000 וס.התקן היא 12,000הממוצע הוא עקב המשבר האחרון בשוק ההון הוחלט להוריד שכר

. 15%לכל המועסקים בשיעור של .1.2ידוע כי ציון התקן של אתי לפני הורדת השכר היה

מכאן נובע כי:. 15%ציון התקן החדש של אתי יקטן ב-

נכון / לא נכון

קשר סטטיסטי בין משתנים

עד עכשיו עסקנו בתיאור נתונים לפי משתנה אחד.רוב החוקרים מעוניינים לחקור מספר משתנים על •

אותה אוכ', כאשר אחת השאלות שמעניינות אותם הם האם קיים קשר בין המשתנים האלה.

מהי משמעות המושג קשר סטטיסטי? הכוונה היא •ששינו בערך אחד של המשתנה גורר אחריו שינוי של

במשתנה השני. )ככל שההשכלה עולה כך השכר עולה(.

המסקנה: אם נמצא קשר בין המשתנים ניתן "לנבא" •( על סמך ידיעת הערך Xאת הערך של משתנה אחד )

(.Yשל המשתנה השני )

קשר ליניארי בין משתנים

קשר לינארי נמדד במשתנים כמותיים.•נהוג לתאר אותו בדיאגרמת פיזור.•

מקדם המתאם

: rמסומן כ-•

מקדם המתאם

)COV )X,Yמשמעות

.Y ו Xמהווה את השונות המשותפת של • המשתנים קיים יחס ישר 2כלומר אם בין •

משמע –שני המשתנים מתפתחים באותו כיוון ו cov )x,y(.יהיה בעל סימן חיובי

כאשר קיים יחס הפוך בין המשתנים תקבל •השונות המשותפת סימן של שלילי.

נקבע עפ"י השונות rהערה: הסימון של •המשותפת.

תכונות מקדם המתאם

תכונות מקדם המתאם

לא קיים קשר לינאריr=0כאשר •

באמצעות Yקו הרגרסיה לניבוי X:

משתנים מאפשר מציאת 2קיום קשר לינארי בין •קו ישר לעריכת תחזית ממשתנה אחד לשני.

החוקר מעוניין במחקר למצוא חוקיות בהתפתחות •התופעה לפיה יהיה ניתן לערוך את התחזית.

- משתנה התלויYנגדיר

- המשתנה הבלתי תלויXנגדיר

קווי התחזית נקראים קווי רגרסיה.•

משוואת קו ישר

קריטריון הריבועים הפוחתים

נוסחאות קו הרגרסיה

תכונות קו הרגרסיה

גדול יותר הקו הישר יהיה bככל שערכו של •תלול יותר.

Y לפי Xקו רגרסיה לניבוי

נוסחאות קו הרגרסיה

הקשר בין מקדמי המתאם לקוויהרגרסיה

שאלות ממבחנים

שאלות ממבחנים

שאלות ממבחנים

מרצה בדק קשר לנארי בין שני משתנים. •לאחר החישובים חלק מהחומר אבד ונשארו

בידיו התוצאות הבאות:•Cov)x,y(=3 6.2 9 ס. תקן

X=4של לפי נתונים אלו ניתן לחשב את קו הרגרסיה •

.X לפי Yלניבוי נכון / לא נכון.

בהצלחה!!!