Upload
others
View
18
Download
0
Embed Size (px)
Citation preview
4שיעור -3סטטיסטיקה
קשר לינארי
מטרות:
.זיהוי הקשר1
. איתור ערכים קיצוניים2
קשר מושלם חיובי
קשר מושלם שלילי
קשר חיובי חלקי קשר שלילי חלקי
אין קשר
במסגרת הקורס לא נוציא ערכים אלו. -ערכים קיצוניים
ההגדרה: -נוסחאת פרסון
Rp ( ל 1-יכול להיות בין )בערך מוחלט( 1( :
Cov(x,x)= שונות של x
אנו יכולים לבחון האם יש קשר, אך אנו COVשל פירסון, כיוון בה R נעדיף לבחון את הקשר על פי
R לא יודעים לתרגם את גודל הקשר למידת העוצמה )נקבל אותה במספרים ולא באחוזים( לעומת
.של פירסון
טרנספורמציות:
rpאינה משנה את מקדם המתאם -או לשניהם x/yהוספה/ החסרה של קבוע ל .1
rpאינה משנה את מקדם המתאים -או של שניהם x/yכפלה/ חילוק פי קבוע של ה .2
טרנפורמציות לינאריות של משנות אתrp טרנספורמציות לא לינאריות משנות את ,rp כמו (
למשל העלאה בריבוע(
Rp מבטא קשר סימטרי במובן שx עלy וy עלx תן תוצאה זההיי.
אוכלוסיה הסקה לאוכלוסיה:
מדגם -rאוכ' , -ρסוגי השערות:
0.3עד קשר חלש
בינוני 0.3-0.6
קשר גבוה 0.6-1
כיוונית חיובית:חד
0:0
0:1
חד כיוונית שלילית:
0:0
0:1
דו כיוונית:
0:0
0:1
הנחות:
דגימה מקרית של תצפיות .1
yמתפלג נורמלית עבור כל ערך של x -התפלגות דו נורמלית .2
3. y מתפלג נורמלית עבור כל ערך שלx
נראית כצורה של קובע על מערכת הצירים. התפלגות דו נורמלית
דיאגרמות פיזור ומתאמים
קשר חיובי חזק .אGraph
No. of learning hours before exam
3530252015105
Te
st m
ark
110
100
90
80
70
60
50
40
30
Correlations
קשר 0.88
חיובי חזק
Sig<0.05
ה.יכלומר מתקיים קשר לינארי באוכלוסי -H0ולכן נדחה
Descriptive Statistics
20.1754 5.03946 109
70.1530 16.22455 109
HOURS No. of learninghours before exam
MARK Test mark
Mean Std. Deviation N
Correlationsb
No. of learning
hours before
exam Test mark
No. of learning hours before
exam
Pearson Correlation 1 .880**
Sig. (2-tailed) .000
Test mark Pearson Correlation .880** 1
Sig. (2-tailed) .000
**. Correlation is significant at the 0.01 level (2-tailed).
b. Listwise N=109
קשר שלילי חזק .ב
Graph
ק"מ לליטר ) צורכים יותר דלק( פחותיותר, נסע גדולככול שנפח המנוע
Correlations
Volume (cubic CM)
200018001600140012001000800600400200
Co
nsu
mp
tio
n (
KM
pe
r L
itte
r)
30
28
26
24
22
20
18
16
14
12
10
Descriptive Statistics
1101.791 300.050 109
19.028 3.499 109
ENGINE Volume(cubic CM)
FUEL Consumption(KM per Litter)
Mean Std. Deviation N
Correlationsb
Volume (cubic
CM)
Consumption
(KM per Litter)
Volume (cubic CM) Pearson Correlation 1 -.704**
Sig. (2-tailed) .000
Consumption (KM per Litter) Pearson Correlation -.704** 1
Sig. (2-tailed) .000
**. Correlation is significant at the 0.01 level (2-tailed).
קשר שלילי חזק
נקודה חשובה: לא יודעים מהי העוצמה באוכ' , אלא רק במדגם.
ק"מ לליטר.ניתן לראות כי מתקיים קשר שלילי באוכ' בין נפח המנוע ול
מתאמים בעוצמות שונות וכיצד הם מתבטאים בדיאגרמת הפיזור .ג
Graph
b. Listwise N=109
Correlationsa
1 .979**
. .000
.979** 1
.000 .
Pearson Correlation
Sig. (2-tai led)
Pearson Correlation
Sig. (2-tai led)
X
Y3
X Y3
Correlation is significant at the 0.01 level(2-tailed).
**.
Listwise N=109a.
X
18 16 14 12 10 8 6 4 2 Y3
14
12
10
8
6
Correlationsa
1 .518**
. .000
.518** 1
.000 .
Pearson Correlation
Sig. (2-tai led)
Pearson Correlation
Sig. (2-tai led)
X
Y4
X Y4
Correlation is significant at the 0.01 level(2-tailed).
**.
Listwise N=109a.
קשר שאינו ליניארי )פרבולי(
X
18161412108642
Y4
25
20
15
10
5
0
X
18161412108642
Y5
30
20
10
0
-10
Correlationsa
1 .122
. .207
.122 1
.207 .
Pearson Correlation
Sig. (2-tailed)
Pearson Correlation
Sig. (2-tailed)
X
Y5
X Y5
Lis twise N=109a.
X
18161412108642
Y6
80
60
40
20
0
-20
Correlations
1 -.043
. .639
120 120
-.043 1
.639 .
120 120
Pearson Correlation
Sig. (2-tai led)
N
Pearson Correlation
Sig. (2-tai led)
N
X
Y6
X Y6
חוסר קשר .ד
ו. השפעות של ערכים קיצוניים
ים את חלישלערכים קיצוניים המ אדוגמ הקשר
כמעט ואין קשר
תצפיות שבניגוד למגמה 4ת אותם נתונים לאחר השמט
קשר בינוני
X
18161412108642
Y
18
16
14
12
10
8
6
4
2
Correlationsa
1 .000
. .998
.000 1
.998 .
Pearson Correlation
Sig. (2-tailed)
Pearson Correlation
Sig. (2-tailed)
X
Y
X Y
Lis twise N=120a.
X
3020100
Y7
30
20
10
0
Correlationsa
1 .023
. .799
.023 1
.799 .
Pearson Correlation
Sig. (2-tailed)
Pearson Correlation
Sig. (2-tailed)
X
Y7
X Y7
Lis twise N=124a.
X
18161412108642
Y7
28
26
24
22
20
18
16
14
12
10
Correlationsa
1 .413**
. .000
.413** 1
.000 .
Pearson Correlation
Sig. (2-tai led)
Pearson Correlation
Sig. (2-tai led)
X
Y7
X Y7
Correlation is significant at the 0.01 level(2-tailed).
**.
Listwise N=120a.
ים את הקשרחזקלערכים קיצוניים המ אדוגמ
תצפיות שגורמות 4אותם נתונים לאחר השמטת
למגמה
רגרסיה לינארית פשוטה
משתנה כמותי -אינסוף קטגוריות -משתנה ב"ת
כמותי -משתנה תלוי
המחושבות לכל ערך קבוע של Y קו באוכלוסייה העובר דרך התוחלות של -עקום הרגרסיה
Xi קו ישר. -1אנו נלמד על עקום רגרסיה -קיימים אינסוף עקומי רגרסיה אפשריים
E(y/x=xi)=µyi LSE יםמהו הקו הטוב ביותר? עקרון ריבועים פחות
min .סטייה/טעות
µyi=α+βxi -הקו באוכלוסיה
-במדגם הקו
Correlationsa
1 .350**
. .000
.350** 1
.000 .
Pearson Correlation
Sig. (2-tai led)
Pearson Correlation
Sig. (2-tai led)
X
Y8
X Y8
Correlation is significant at the 0.01 level(2-tailed).
**.
Listwise N=124a.
X
2520151050
Y8
40
30
20
10
0
-10
X
18161412108642
Y8
30
20
10
0
-10
Correlationsa
1 .128
. .165
.128 1
.165 .
Pearson Correlation
Sig. (2-tailed)
Pearson Correlation
Sig. (2-tailed)
X
Y8
X Y8
Lis twise N=120a.