למדנו לבצע בדיקת השערות לממוצע מדגם

Preview:

DESCRIPTION

למדנו לבצע בדיקת השערות לממוצע מדגם. על מנת לבצע בדיקת השערות עלינו לדעת: את ממוצע האוכלוסייה "הרגילה". סטיית התקן של האוכלוסייה (הרגילה או עם הטיפול מאחר והנחנו שוויון שונויות). הבעיה היא שלרב אנו לא יודעים את הפרמטרים של האוכלוסייה. ומה כאשר סטיית התקן של האוכלוסייה לא ידועה?. - PowerPoint PPT Presentation

Citation preview

n

xz

למדנו לבצע בדיקת השערות לממוצע מדגם.

על מנת לבצע בדיקת השערות עלינו לדעת:את ממוצע האוכלוסייה "הרגילה".1.סטיית התקן של האוכלוסייה )הרגילה או עם הטיפול מאחר 2.

והנחנו שוויון שונויות(

הבעיה היא שלרב אנו לא יודעים את הפרמטרים של האוכלוסייה

, Sn) )סטיות תקןאם בונים התפלגות דגימה של התוחלת של סטיות התקן תהיה שונה מסטיית התקן

(.) של האוכלוסייה ממנה נדגמו המדגמים

. הוא אומדן מוטה ל-Snמכאן ש-

.הוא אומד חסר הטיה ל- Sn-1ניתן להוכיח ש-

)(1snE

)(snE

appletמה תהיה צורתה של התפלגות הדגימה של סטיות תקן?

לא האוכלוסייה של התקן סטיית כאשר ומהידועה?

1

1

2

1

nS

n

in

xxi

2

1

)1(~2

1

2

n

nns

2

sn2

1sn2

1 sn2

1

)1( n 2

2

1)1( snn

2

2

1)1( snn

2

2

1)1( snn

dfn

dfn

222

1

22

2

התפלגויות שונותמשפחה של

tהתפלגות

n ידועים, התפלגות הדגימה של ממוצעים עבור ו-כאשר מספיק גדול תתפלג נורמלית

nNx

,~

אבל לרב הפרמטרים של האוכלוסייה אינם ידועים. לא, ניתן לאמוד אותה. ידוע אך אם

הוא2אומד חסר ההטיה ל-

אומד חסר הטיה הוא אומד שממוצע התפלגות הדגימה שלו שווה לפרמטר האוכלוסייה. במקרה הפרטי, אם נדגום

ונחשב בכל מדגם את האומדן nאינסוף מדגמים בגודל .2הממוצע של כל האומדנים יהיה שווה ל-

S n

2

)1(

S n

2

)1(

לכן: אם סטיית התקן של האוכלוסייה אינה ידועה

ניתן להשתמש באומדן שלה:

11

2

1

n

xxn

ii

nss

1

n

nnss אזי:Snאם כבר חישבנו את

כי: 1

1

2

1

2

111

n

n

ii

n

ii

n ssn

xx

n

n

n

xx

n

n

ובחזרה להתפלגות הדגימה של ממוצעים. מאחר ואנו משתמשים באומדן לסטיית התקן במקום בפרמטר, יש

גורם נוסף לטעות.

מכאן שסטיית התקן של התפלגות הדגימה תהיה גדולה יותר.

הפתרון הוא שימוש בהתפלגות אחרת, התפלגות "רחבה" יותר מההתפלגות הנורמלית. התפלגות זאת קרויה

.tהתפלגות יהיה:תצפית בודדתעכשיו הסטטיסטי שלנו עבור

sxt

n

xi

1

t אינו מתפלג נורמלית אלא מתפלג t שהיא התפלגות רחבה יותר.

היא בעצם משפחה של התפלגויות tיתרה מכך התפלגות ככל שמספר (d.f.=n-1כפונקציה של דרגות החופש )ד"ח=

( מדויק יותר )קרוב sהתצפיות גדול יותר, כך האומדן שלנו ) צרה יותר ושואפת לנורמלית.t( והתפלגות יותר ל-

?df=n-1למה William Gosset: Student’s t

Guinness's brewery

ובהתפלגות דגימה של ממוצעים:

x

x

n

x

Sn

xsx

t

1

2,0

1,0

~~

df

df

N

ttz

מתי

x

x

S

x יתפלגt?

מתפלג נורמליתxכאשר 1.

n>30 כאשר או2.

nss n

x1

1

nss n

x

מכאן, תהליך בדיקת ההשערות זהה לחלוטין לבדיקת השערות על .zממוצע כפי שלמדנו עם

aH

aH

:

:

1

0

aH

aH

:

:

1

0או

1)

.n>30 מתפלג נורמלית, או x( הנחות: 2

( חישוב הסטטיסטי3

p לערך הקריטי בטבלה, או חישוב t( השוואת הסטטיסטי 4 EXCELבאמצעות

nsx

tn

x

1

=TDIST)t,df,tails(

מבחן דו-צדדי2 מבחן חד-צדדי1

מקבל ערכים חיוביים בלבד!

NORMSDIST TDIST 1-

nsxt

דוגמא

₪ .6500ידוע שההכנסה הממוצעת של משפחה ישראלית היא )לפני איסוף הנתונים( שתושבי הצפון מרוויחים טועןכלכלן ממשרד האוצר

מעל לממוצע האוכלוסייה. מתושבי הצפון ומצא שממוצע ההכנסה שלהם עמד של40הוא דגם מקרית

. s=700 ₪ ו-0007?0.05האם טענת הכלכלן מוצדקת ברמת מובהקות של

6500:

6500:

1

0

H

H

52.4

40700

65007000

t

05.0

ולומר שהכלכלן צדק.H0לכן ניתן לדחות את

.t, התפלגות הדגימה היא n>30מכוון ש

1)

2)

3)

)לכל היותר(1.697 הוא df=39 חד-צדדי עם =0.05הערך הקריטי עבור (4

=TDIST)4.52,39,1(=2.8E-05 0001.05.,52.4)39( ppt

697.1)1,05.0,30(

684.1)1,05.0,40(

t

tטבלה

( מהי עוצמת המבחן שביצע הכלכלן אם מתברר שכלל תושבי הצפון 5 ₪?6900מרוויחים בממוצע

TINV)0.1,39(=1.68

לשים לב! הפקודה היא דו-צדדית, לכן בהשערה חד-צדדית יש להכפיל את .2ב-

=TINV),df(דו צדדי

94.668540

70068.16500

)(

n

stx cc

93.1

40

700690094.6685

t

0.03=TDIST)1.93,39,1( 97.01

6500 6900

H0 H1

1

n

nnss :, הראנו שSnאם כבר חישבנו את

לכן:

1

nx sS

n

1

11

nn

n

n

n

ssss nn

nx

כי

x

x

S

xt 1

1

nnsss nn

x

1

)1,2()1,2( xnxnstxstxp

אם סטיית התקן של האוכלוסייה אינה ידועה, אזי נוכל לבנות .tרווח בר סמך בהתבסס על התפלגות

דוגמה: 4000 נמצא שההכנסה הממוצעת היתה n=30במדגם בגודל

95%. ברמת בטחון של 0s=300עם אומדן לסטיית התקן ((=0.05?מהו ממוצע ההכנסה של כלל האוכלוסייה ,

72.54730

3000

n

ssx

72.547*045.2400072.547*045.24000

09.512091.2879

=TINV),df(

רווח בר סמך לממוצע האוכלוסייה

2.045(=TINV)0.05,29

דוגמא:שרת החינוך רוצה לדעת מהו הממוצע בחשבון של כלל 10התלמידי י"ב בישראל. לשם כך היא דגמה באופן מקרי

תלמידי י"ב. בהנחה שציוני חשבון מתפלגים נורמלית, מהו ?95%ממוצע באוכלוסייה ברמת בטחון של

.70,60,80,90,60,73,76,81,90,65להלן הנתונים:

1

)1,2()1,2( xnxnstxstxp

%9537.8263.66 p

2

2

(()

1

(()

)

)

i

i

EXCEL

stdevn

stdevpn

xx

xx

מאחר ומדובר בתהליך איטרטיבי.t מינימלי בהתפלגות nלא נעסוק ב-

הוא הבסיס למשפחת הסטטיסטיקה tמבחן הפרמטרית:

ניתוח שונות•רגרסיה•

זו הסטטיסטיקה הרווחת בשוק.דרישות:

משתנים בסולם רווח/יחס )מבוססת על ממוצעים(התפלגות דגימה נורמלית

למרות שרב המשתנים במדעי החברה לא עונים לדרישות אלו, הסטטיסטיקה הרווחת היא פרמטרית.

דגימה מקרית:כל המבחנים הסטטיסטיים מבוססים על דגימה מקרית. דגימה שבה לכל פרט באוכלוסייה יש סיכוי זהה להיכלל

במדגם.זו הנחה שכמובן לרב לא מתקיימת. אי קיומה פוגעת גם

ביכולת ההכללה של הממצאים )תוקף חיצוני(.

לכל מחקר ארבעה סוגי תוקף עיקריים: - עד כמה ההגדרה האופרציונלית של תוקף מבנה•

המשתנים תואמת את ההגדרה התיאורטית. - האם המשתנה הבלתי תלוי הוא הסיבה תוקף פנימי•

למשתנה התלוי או שמא ישנם משתנים חיצוניים המתערבים במחקר.

- עוצמת המבחן, טעות מסוג תוקף המסקנה הסטטיסטית •I.בחירת המבחן הסטטיסטי , - יכולת הכללה של הממצאים )דגימה מייצגת(תוקף חיצוני•

Recommended