Upload
ivy-mooney
View
73
Download
5
Embed Size (px)
DESCRIPTION
你的账号 “ 值钱 ” 吗?. —— 解密人人成绩单. 组员:田源,尚智伟,郭志嘉,管美娜,程晨曼,陈楚辞. 回归分析. 自变量与因变量的关系. 回归方程为 头像得分 = 18.7 + 0.561 transc3ln + 0.222 transc4ln + 0.404 transc5ln 自变量 系数 系数标准误 差 T P 常量 18.720 3.009 6.22 0.000 transc3ln 0.56076 0.05939 9.44 0.000 - PowerPoint PPT Presentation
Citation preview
你的账号“值钱”吗?—— 解密人人成绩单组员:田源,尚智伟,郭志嘉,管美娜,程晨曼,陈楚辞
回归分析
自变量与因变量的关系
0 1000 2000 3000 4000 5000 6000 7000 8000 90000
20
40
60
80
100
120
f(x) = 11.307271051309 ln(x) + 7.3104769855706R² = 0.857541292855705
头像得分与头像浏览量之间的关系
0 50 100 150 200 250 3000
20
40
60
80
100
120
f(x) = 8.53880033805483 ln(x) + 56.6215050950146R² = 0.69590607691588
头像得分与头像被回复数量之间的关系
0 10 20 30 40 50 600
20
40
60
80
100
120
f(x) = 16.0574335484447 ln(x) + 44.026812929476R² = 0.747132909897564
头像得分与头像被分享数量之间的关系
1050-5-10
99. 999
90
50
10
10. 1
残差
百分比
100806040
10
5
0
-5
-10
拟合值
残差
1050-5-10
20
15
10
5
0
残差
频率
9080706050403020101
10
5
0
-5
-10
观测值顺序
残差
正态概率图 与拟合值
直方图 与顺序
头像得分 残差图
回归方程为头像得分 = 18.7 + 0.561 transc3ln + 0.222 transc4ln + 0.404 transc5ln
自变量 系数 系数标准误差 T P
常量 18.720 3.009 6.22 0.000
transc3ln 0.56076 0.05939 9.44 0.000
transc4ln 0.22195 0.06027 3.68 0.000
transc5ln 0.40358 0.05391 7.49 0.000
S = 3.87640 R-Sq = 93.7% R-Sq (调整) = 93.4%
20100-10
99. 999
90
50
10
10. 1
残差
百分比
1007550250
151050
-5
拟合值
残差
1612840-4-8
16
12
8
4
0
残差
频率
9080706050403020101
151050
-5
观测值顺序
残差
正态概率图 与拟合值
直方图 与顺序
相片得分 残差图
自变量 系数 系数标准误 T P常量 -23.862 3.678 -6.49 0.000transc13ln 0.41359 0.05645 7.33 0.000transc14ln 0.45898 0.06895 6.66 0.000transc15ln 0.21019 0.05890 3.57 0.001 S = 4.33975 R-Sq = 95.9% R-Sq (调整) = 95.7%
相片得分 = - 23.9 + 0.414 *13.126*LN (相片数) + 0.459 *12.468*LN (相片浏览量) + 0.210 *12.557*LN (相片回复数)
相片
5. 02. 50. 0-2. 5-5. 0
99
90
50
10
1
残差
百分比
10090807060
5. 0
2. 5
0. 0
-2. 5
-5. 0
拟合值
残差
420-2-4-6
20
15
10
5
0
残差
频率
9080706050403020101
5. 0
2. 5
0. 0
-2. 5
-5. 0
观测值顺序
残差
正态概率图 与拟合值
直方图 与顺序
日志得分 残差图
自变量 系数 系数标准误 T P常量 37.465 2.627 14.26 0.000transc24ln 0.30671 0.06010 5.10 0.000transc25ln 0.30895 0.08932 3.46 0.001transc26ln 0.40030 0.06571 6.09 0.000transc27ln 0.39461 0.07313 5.40 0.000 S = 2.12912 R-Sq = 95.8% R-Sq (调整) = 95.4%
日志得分 = 37.5 + 0.307 *0.7075* 日志数 + 0.309 *8.2539*LN (日志浏览量) + 0.400 *5.42*LN (日志分享) + 0.395 *7.6934*LN (日志回复)
日志
40200-20-40
99. 999
90
50
10
10. 1
Resi dual
Perc
ent
N 79AD 1. 569P-Val ue <0. 005
1251007550
0
-20
-40
Fi tted Val ue
Resi
dual
100-10-20-30-40
16
12
8
4
0
Resi dual
Freq
uenc
y
9080706050403020101
0
-20
-40
Observati on Order
Resi
dual
Normal Probabi l i ty Pl ot Versus Fi ts
Hi stogram Versus Order
Resi dual Pl ots for 相片得分
(注: Y=AX 是原始数据在没有经过任何处理时线性回归的结果)
40 50 60 70 80 90 100 110 120 130
-50
-40
-30
-20
-10
0
10
20
f(x) = − 0.0000000340525 x⁶ + 0.0000186878 x⁵ − 0.00423893 x⁴ + 0.508732 x³ − 34.08608 x² + 1209.342 x − 17740.43R² = 0.93233310338742
“ 相片得分”残差与拟合值的关系
拟合值
残差值
年级 vs 得分 one-way ANOVA
Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -+---------+---------+---------+-------- 1 17 61.12 8.44 (-*-) 2 20 82.05 4.74 (*-) 3 16 92.44 2.28 (-*-) 4 21 99.24 1.14 (-*) -+---------+---------+---------+-------- 60 72 84 96 Pooled StDev = 4.89
发现异常数据
性别:男 性别:女
分男女对不同项目得分回归分析
男生日志得分与参数的回归结果回归分析:日志得分 与 trans日志, trans浏览量, trans分享, trans回复 回归方程为 日志得分 = 33.5 + 2.49 trans日志 + 2.47 trans浏览量 + 1.82 trans分享 + 3.62 trans回复 使用了 31 个案例,21 个案例包含缺失值 自变量 系数 系数标准误 T P 常量 33.536 3.473 9.66 0.000 trans日志 2.4865 0.6752 3.68 0.001 trans浏览量 2.4658 0.8736 2.82 0.009 trans分享 1.8234 0.3730 4.89 0.000 trans回复 3.6237 0.6969 5.20 0.000 S = 2.01227 R-Sq = 95.2% R-Sq(调整) = 94.5%
女生日志得分与参数的回归结果
回归分析:日志得分_1 与 trans日志1, trans分享1, trans浏览量1, trans回复1 回归方程为 日志得分_1 = 31.1 + 4.97 trans日志1 + 2.06 trans分享1 + 2.92 trans浏览量1 + 2.05 trans回复1 使用了 12 个案例,27 个案例包含缺失值 系数标 自变量 系数 准误 T P 常量 31.09 17.64 1.76 0.121 trans日志1 4.973 2.086 2.38 0.049 trans分享1 2.060 2.397 0.86 0.418 trans浏览量1 2.921 4.811 0.61 0.563 trans回复1 2.048 2.372 0.86 0.416 S = 1.78911 R-Sq = 93.3% R-Sq(调整) = 89.5%
男女日志回归结果对比日志得分 _ 男 = 33.5 + 2.49 trans 日志 + 2.47 trans 浏览量 + 1.82 trans 分享 + 3.62 trans 回复
日志得分 _ 女 = 31.1 + 4.97 trans 日志 1 + 2.92 trans 浏览量 1 + 2.06 trans 分享 1 + 2.05 trans 回复 1
男女相片回归结果对比相片得分 _ 女 = - 10.5 + 4.4 tran_M1 + 4.03 tran_M2 + 4.25 tran_M3
相片得分 _ 男 = - 13.5 + 5.05 tran_W1 + 5.64 tran_W2 + 6.27 tran_W3
男女头像回归结果对比头像得分 _ 男 = 11.9 + 8.64 tran_M1 + 0.363 tran_M2 + 3.50 tran_M3
头像得分 _ 女 = 38.9 + 3.97 tran_W1 + 0.727 tran_W2 + 4.19 tran_W3
发现异常数据
性别:男 性别:女
成果检测基于回归拟合结果设计一款类似的 app
数据检测现场演示成功还原此应用
Thanks! Q&A