10
סטטיסטיקה3 - שיעור4 קשר לינארי מטרות:1 .זיהוי הקשר2 . איתור ערכים קיצוניים קשר מושלם חיובי קשר מושלם שלילי קשר שלילי חלקי קשר חיובי חלקי אין קשר ערכים קיצוניים- במסגרת הקורס לא נוציא ערכים אלו.

רועיש הקיטסיטטסbizlearn.colman.ac.il/wp-content/uploads/2016/12/שיעור-4.pdf · :הרדגהה ןוסרפ תאחסונ)טלחומ ךרעב( : ל ) ( ןיב תויהל

  • Upload
    others

  • View
    18

  • Download
    0

Embed Size (px)

Citation preview

4שיעור -3סטטיסטיקה

קשר לינארי

מטרות:

.זיהוי הקשר1

. איתור ערכים קיצוניים2

קשר מושלם חיובי

קשר מושלם שלילי

קשר חיובי חלקי קשר שלילי חלקי

אין קשר

במסגרת הקורס לא נוציא ערכים אלו. -ערכים קיצוניים

ההגדרה: -נוסחאת פרסון

Rp ( ל 1-יכול להיות בין )בערך מוחלט( 1( :

Cov(x,x)= שונות של x

אנו יכולים לבחון האם יש קשר, אך אנו COVשל פירסון, כיוון בה R נעדיף לבחון את הקשר על פי

R לא יודעים לתרגם את גודל הקשר למידת העוצמה )נקבל אותה במספרים ולא באחוזים( לעומת

.של פירסון

טרנספורמציות:

rpאינה משנה את מקדם המתאם -או לשניהם x/yהוספה/ החסרה של קבוע ל .1

rpאינה משנה את מקדם המתאים -או של שניהם x/yכפלה/ חילוק פי קבוע של ה .2

טרנפורמציות לינאריות של משנות אתrp טרנספורמציות לא לינאריות משנות את ,rp כמו (

למשל העלאה בריבוע(

Rp מבטא קשר סימטרי במובן שx עלy וy עלx תן תוצאה זההיי.

אוכלוסיה הסקה לאוכלוסיה:

מדגם -rאוכ' , -ρסוגי השערות:

0.3עד קשר חלש

בינוני 0.3-0.6

קשר גבוה 0.6-1

כיוונית חיובית:חד

0:0

0:1

חד כיוונית שלילית:

0:0

0:1

דו כיוונית:

0:0

0:1

הנחות:

דגימה מקרית של תצפיות .1

yמתפלג נורמלית עבור כל ערך של x -התפלגות דו נורמלית .2

3. y מתפלג נורמלית עבור כל ערך שלx

נראית כצורה של קובע על מערכת הצירים. התפלגות דו נורמלית

דיאגרמות פיזור ומתאמים

קשר חיובי חזק .אGraph

No. of learning hours before exam

3530252015105

Te

st m

ark

110

100

90

80

70

60

50

40

30

Correlations

קשר 0.88

חיובי חזק

Sig<0.05

ה.יכלומר מתקיים קשר לינארי באוכלוסי -H0ולכן נדחה

Descriptive Statistics

20.1754 5.03946 109

70.1530 16.22455 109

HOURS No. of learninghours before exam

MARK Test mark

Mean Std. Deviation N

Correlationsb

No. of learning

hours before

exam Test mark

No. of learning hours before

exam

Pearson Correlation 1 .880**

Sig. (2-tailed) .000

Test mark Pearson Correlation .880** 1

Sig. (2-tailed) .000

**. Correlation is significant at the 0.01 level (2-tailed).

b. Listwise N=109

קשר שלילי חזק .ב

Graph

ק"מ לליטר ) צורכים יותר דלק( פחותיותר, נסע גדולככול שנפח המנוע

Correlations

Volume (cubic CM)

200018001600140012001000800600400200

Co

nsu

mp

tio

n (

KM

pe

r L

itte

r)

30

28

26

24

22

20

18

16

14

12

10

Descriptive Statistics

1101.791 300.050 109

19.028 3.499 109

ENGINE Volume(cubic CM)

FUEL Consumption(KM per Litter)

Mean Std. Deviation N

Correlationsb

Volume (cubic

CM)

Consumption

(KM per Litter)

Volume (cubic CM) Pearson Correlation 1 -.704**

Sig. (2-tailed) .000

Consumption (KM per Litter) Pearson Correlation -.704** 1

Sig. (2-tailed) .000

**. Correlation is significant at the 0.01 level (2-tailed).

קשר שלילי חזק

נקודה חשובה: לא יודעים מהי העוצמה באוכ' , אלא רק במדגם.

ק"מ לליטר.ניתן לראות כי מתקיים קשר שלילי באוכ' בין נפח המנוע ול

מתאמים בעוצמות שונות וכיצד הם מתבטאים בדיאגרמת הפיזור .ג

Graph

b. Listwise N=109

Correlationsa

1 .979**

. .000

.979** 1

.000 .

Pearson Correlation

Sig. (2-tai led)

Pearson Correlation

Sig. (2-tai led)

X

Y3

X Y3

Correlation is significant at the 0.01 level(2-tailed).

**.

Listwise N=109a.

X

18 16 14 12 10 8 6 4 2 Y3

14

12

10

8

6

Correlationsa

1 .518**

. .000

.518** 1

.000 .

Pearson Correlation

Sig. (2-tai led)

Pearson Correlation

Sig. (2-tai led)

X

Y4

X Y4

Correlation is significant at the 0.01 level(2-tailed).

**.

Listwise N=109a.

קשר שאינו ליניארי )פרבולי(

X

18161412108642

Y4

25

20

15

10

5

0

X

18161412108642

Y5

30

20

10

0

-10

Correlationsa

1 .122

. .207

.122 1

.207 .

Pearson Correlation

Sig. (2-tailed)

Pearson Correlation

Sig. (2-tailed)

X

Y5

X Y5

Lis twise N=109a.

X

18161412108642

Y6

80

60

40

20

0

-20

Correlations

1 -.043

. .639

120 120

-.043 1

.639 .

120 120

Pearson Correlation

Sig. (2-tai led)

N

Pearson Correlation

Sig. (2-tai led)

N

X

Y6

X Y6

חוסר קשר .ד

ו. השפעות של ערכים קיצוניים

ים את חלישלערכים קיצוניים המ אדוגמ הקשר

כמעט ואין קשר

תצפיות שבניגוד למגמה 4ת אותם נתונים לאחר השמט

קשר בינוני

X

18161412108642

Y

18

16

14

12

10

8

6

4

2

Correlationsa

1 .000

. .998

.000 1

.998 .

Pearson Correlation

Sig. (2-tailed)

Pearson Correlation

Sig. (2-tailed)

X

Y

X Y

Lis twise N=120a.

X

3020100

Y7

30

20

10

0

Correlationsa

1 .023

. .799

.023 1

.799 .

Pearson Correlation

Sig. (2-tailed)

Pearson Correlation

Sig. (2-tailed)

X

Y7

X Y7

Lis twise N=124a.

X

18161412108642

Y7

28

26

24

22

20

18

16

14

12

10

Correlationsa

1 .413**

. .000

.413** 1

.000 .

Pearson Correlation

Sig. (2-tai led)

Pearson Correlation

Sig. (2-tai led)

X

Y7

X Y7

Correlation is significant at the 0.01 level(2-tailed).

**.

Listwise N=120a.

ים את הקשרחזקלערכים קיצוניים המ אדוגמ

תצפיות שגורמות 4אותם נתונים לאחר השמטת

למגמה

רגרסיה לינארית פשוטה

משתנה כמותי -אינסוף קטגוריות -משתנה ב"ת

כמותי -משתנה תלוי

המחושבות לכל ערך קבוע של Y קו באוכלוסייה העובר דרך התוחלות של -עקום הרגרסיה

Xi קו ישר. -1אנו נלמד על עקום רגרסיה -קיימים אינסוף עקומי רגרסיה אפשריים

E(y/x=xi)=µyi LSE יםמהו הקו הטוב ביותר? עקרון ריבועים פחות

min .סטייה/טעות

µyi=α+βxi -הקו באוכלוסיה

-במדגם הקו

Correlationsa

1 .350**

. .000

.350** 1

.000 .

Pearson Correlation

Sig. (2-tai led)

Pearson Correlation

Sig. (2-tai led)

X

Y8

X Y8

Correlation is significant at the 0.01 level(2-tailed).

**.

Listwise N=124a.

X

2520151050

Y8

40

30

20

10

0

-10

X

18161412108642

Y8

30

20

10

0

-10

Correlationsa

1 .128

. .165

.128 1

.165 .

Pearson Correlation

Sig. (2-tailed)

Pearson Correlation

Sig. (2-tailed)

X

Y8

X Y8

Lis twise N=120a.

iii -ערך אמיתי באוכ' xy

-ערך אמיתי במדגם

x

y

xs

sr

s

yx

ˆ

ˆ

ˆ

),cov(ˆ2

xy ˆˆ

.xשל , לא yאנו נעבוד עם הקו של

קווי מתאם, לאוכלוסייה הסקה, פירסון של הלינארי המתאם, פשוטה לרגרסיה, לינארי קשר

הרגרסיה עקום, פלט ניתוח, מדגם, מדגם