25
你你你你“你你”你—— 你你你你你你你 组组 组组组 组组组组 组组组组 组组组组 组组组组 组组组 :,,,,,

你的账号 “ 值钱 ” 吗?

Embed Size (px)

DESCRIPTION

你的账号 “ 值钱 ” 吗?. —— 解密人人成绩单. 组员:田源,尚智伟,郭志嘉,管美娜,程晨曼,陈楚辞. 回归分析. 自变量与因变量的关系. 回归方程为 头像得分 = 18.7 + 0.561 transc3ln + 0.222 transc4ln + 0.404 transc5ln 自变量 系数 系数标准误 差 T P 常量 18.720 3.009 6.22 0.000 transc3ln 0.56076 0.05939 9.44 0.000 - PowerPoint PPT Presentation

Citation preview

Page 1: 你的账号 “ 值钱 ” 吗?

你的账号“值钱”吗?—— 解密人人成绩单组员:田源,尚智伟,郭志嘉,管美娜,程晨曼,陈楚辞

Page 2: 你的账号 “ 值钱 ” 吗?
Page 3: 你的账号 “ 值钱 ” 吗?

回归分析

Page 4: 你的账号 “ 值钱 ” 吗?

自变量与因变量的关系

0 1000 2000 3000 4000 5000 6000 7000 8000 90000

20

40

60

80

100

120

f(x) = 11.307271051309 ln(x) + 7.3104769855706R² = 0.857541292855705

头像得分与头像浏览量之间的关系

Page 5: 你的账号 “ 值钱 ” 吗?

0 50 100 150 200 250 3000

20

40

60

80

100

120

f(x) = 8.53880033805483 ln(x) + 56.6215050950146R² = 0.69590607691588

头像得分与头像被回复数量之间的关系

Page 6: 你的账号 “ 值钱 ” 吗?

0 10 20 30 40 50 600

20

40

60

80

100

120

f(x) = 16.0574335484447 ln(x) + 44.026812929476R² = 0.747132909897564

头像得分与头像被分享数量之间的关系

Page 7: 你的账号 “ 值钱 ” 吗?

1050-5-10

99. 999

90

50

10

10. 1

残差

百分比

100806040

10

5

0

-5

-10

拟合值

残差

1050-5-10

20

15

10

5

0

残差

频率

9080706050403020101

10

5

0

-5

-10

观测值顺序

残差

正态概率图 与拟合值

直方图 与顺序

头像得分 残差图

Page 8: 你的账号 “ 值钱 ” 吗?

回归方程为头像得分 = 18.7 + 0.561 transc3ln + 0.222 transc4ln + 0.404 transc5ln

自变量 系数 系数标准误差 T P

常量 18.720 3.009 6.22 0.000

transc3ln 0.56076 0.05939 9.44 0.000

transc4ln 0.22195 0.06027 3.68 0.000

transc5ln 0.40358 0.05391 7.49 0.000

 

S = 3.87640 R-Sq = 93.7% R-Sq (调整) = 93.4%

Page 9: 你的账号 “ 值钱 ” 吗?

20100-10

99. 999

90

50

10

10. 1

残差

百分比

1007550250

151050

-5

拟合值

残差

1612840-4-8

16

12

8

4

0

残差

频率

9080706050403020101

151050

-5

观测值顺序

残差

正态概率图 与拟合值

直方图 与顺序

相片得分 残差图

自变量 系数 系数标准误 T P常量 -23.862 3.678 -6.49 0.000transc13ln 0.41359 0.05645 7.33 0.000transc14ln 0.45898 0.06895 6.66 0.000transc15ln 0.21019 0.05890 3.57 0.001 S = 4.33975 R-Sq = 95.9% R-Sq (调整) = 95.7%

相片得分 = - 23.9 + 0.414 *13.126*LN (相片数) + 0.459 *12.468*LN (相片浏览量) + 0.210 *12.557*LN (相片回复数)

相片

Page 10: 你的账号 “ 值钱 ” 吗?

5. 02. 50. 0-2. 5-5. 0

99

90

50

10

1

残差

百分比

10090807060

5. 0

2. 5

0. 0

-2. 5

-5. 0

拟合值

残差

420-2-4-6

20

15

10

5

0

残差

频率

9080706050403020101

5. 0

2. 5

0. 0

-2. 5

-5. 0

观测值顺序

残差

正态概率图 与拟合值

直方图 与顺序

日志得分 残差图

自变量 系数 系数标准误 T P常量 37.465 2.627 14.26 0.000transc24ln 0.30671 0.06010 5.10 0.000transc25ln 0.30895 0.08932 3.46 0.001transc26ln 0.40030 0.06571 6.09 0.000transc27ln 0.39461 0.07313 5.40 0.000 S = 2.12912 R-Sq = 95.8% R-Sq (调整) = 95.4%

日志得分 = 37.5 + 0.307 *0.7075* 日志数 + 0.309 *8.2539*LN (日志浏览量) + 0.400 *5.42*LN (日志分享) + 0.395 *7.6934*LN (日志回复)

日志

Page 11: 你的账号 “ 值钱 ” 吗?

40200-20-40

99. 999

90

50

10

10. 1

Resi dual

Perc

ent

N 79AD 1. 569P-Val ue <0. 005

1251007550

0

-20

-40

Fi tted Val ue

Resi

dual

100-10-20-30-40

16

12

8

4

0

Resi dual

Freq

uenc

y

9080706050403020101

0

-20

-40

Observati on Order

Resi

dual

Normal Probabi l i ty Pl ot Versus Fi ts

Hi stogram Versus Order

Resi dual Pl ots for 相片得分

Page 12: 你的账号 “ 值钱 ” 吗?

(注: Y=AX 是原始数据在没有经过任何处理时线性回归的结果)

Page 13: 你的账号 “ 值钱 ” 吗?

40 50 60 70 80 90 100 110 120 130

-50

-40

-30

-20

-10

0

10

20

f(x) = − 0.0000000340525 x⁶ + 0.0000186878 x⁵ − 0.00423893 x⁴ + 0.508732 x³ − 34.08608 x² + 1209.342 x − 17740.43R² = 0.93233310338742

“ 相片得分”残差与拟合值的关系

拟合值

残差值

Page 14: 你的账号 “ 值钱 ” 吗?

年级 vs 得分 one-way ANOVA

Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -+---------+---------+---------+-------- 1 17 61.12 8.44 (-*-) 2 20 82.05 4.74 (*-) 3 16 92.44 2.28 (-*-) 4 21 99.24 1.14 (-*) -+---------+---------+---------+-------- 60 72 84 96 Pooled StDev = 4.89

Page 15: 你的账号 “ 值钱 ” 吗?

发现异常数据

性别:男 性别:女

Page 16: 你的账号 “ 值钱 ” 吗?

分男女对不同项目得分回归分析

Page 17: 你的账号 “ 值钱 ” 吗?

男生日志得分与参数的回归结果回归分析:日志得分 与 trans日志, trans浏览量, trans分享, trans回复 回归方程为 日志得分 = 33.5 + 2.49 trans日志 + 2.47 trans浏览量 + 1.82 trans分享 + 3.62 trans回复 使用了 31 个案例,21 个案例包含缺失值 自变量 系数 系数标准误 T P 常量 33.536 3.473 9.66 0.000 trans日志 2.4865 0.6752 3.68 0.001 trans浏览量 2.4658 0.8736 2.82 0.009 trans分享 1.8234 0.3730 4.89 0.000 trans回复 3.6237 0.6969 5.20 0.000 S = 2.01227 R-Sq = 95.2% R-Sq(调整) = 94.5%

Page 18: 你的账号 “ 值钱 ” 吗?

女生日志得分与参数的回归结果

回归分析:日志得分_1 与 trans日志1, trans分享1, trans浏览量1, trans回复1 回归方程为 日志得分_1 = 31.1 + 4.97 trans日志1 + 2.06 trans分享1 + 2.92 trans浏览量1 + 2.05 trans回复1 使用了 12 个案例,27 个案例包含缺失值 系数标 自变量 系数 准误 T P 常量 31.09 17.64 1.76 0.121 trans日志1 4.973 2.086 2.38 0.049 trans分享1 2.060 2.397 0.86 0.418 trans浏览量1 2.921 4.811 0.61 0.563 trans回复1 2.048 2.372 0.86 0.416 S = 1.78911 R-Sq = 93.3% R-Sq(调整) = 89.5%

Page 19: 你的账号 “ 值钱 ” 吗?

男女日志回归结果对比日志得分 _ 男 = 33.5 + 2.49 trans 日志 + 2.47 trans 浏览量 + 1.82 trans 分享 + 3.62 trans 回复

日志得分 _ 女 = 31.1 + 4.97 trans 日志 1 + 2.92 trans 浏览量 1 + 2.06 trans 分享 1 + 2.05 trans 回复 1

Page 20: 你的账号 “ 值钱 ” 吗?

男女相片回归结果对比相片得分 _ 女 = - 10.5 + 4.4 tran_M1 + 4.03 tran_M2 + 4.25 tran_M3

相片得分 _ 男 = - 13.5 + 5.05 tran_W1 + 5.64 tran_W2 + 6.27 tran_W3

Page 21: 你的账号 “ 值钱 ” 吗?

男女头像回归结果对比头像得分 _ 男 = 11.9 + 8.64 tran_M1 + 0.363 tran_M2 + 3.50 tran_M3

头像得分 _ 女 = 38.9 + 3.97 tran_W1 + 0.727 tran_W2 + 4.19 tran_W3

Page 22: 你的账号 “ 值钱 ” 吗?

发现异常数据

性别:男 性别:女

Page 23: 你的账号 “ 值钱 ” 吗?
Page 24: 你的账号 “ 值钱 ” 吗?

成果检测基于回归拟合结果设计一款类似的 app

数据检测现场演示成功还原此应用

Page 25: 你的账号 “ 值钱 ” 吗?

Thanks! Q&A