30
移动端O2O推荐的Online Learning实战 孔东营

美团技术沙龙02 - 移动端O2O推荐的Online Learning实战

  • View
    1.270

  • Download
    1

Embed Size (px)

Citation preview

Page 1: 美团技术沙龙02 - 移动端O2O推荐的Online Learning实战

移动端O2O推荐的Online Learning实战

孔东营

Page 2: 美团技术沙龙02 - 移动端O2O推荐的Online Learning实战

个⼈人介绍

孔东营

2010 - 2013 中科院计算所 硕⼠士研究⽣生

2013 - 2014 ⺴⽹网易有道 ⼲⼴广告算法⼯工程师

2015 - 今天 美团 推荐算法⼯工程师

Page 3: 美团技术沙龙02 - 移动端O2O推荐的Online Learning实战

⺫⽬目录

2.美团推荐系统介绍

4.计划与展望

1.美团移动端O2O推荐概述

3.Online Learning 重排序

Page 4: 美团技术沙龙02 - 移动端O2O推荐的Online Learning实战

⺫⽬目录

2.美团推荐系统介绍

4.计划与展望

1.美团移动端O2O推荐概述

3.Online Learning 重排序

Page 5: 美团技术沙龙02 - 移动端O2O推荐的Online Learning实战

美团移动端O2O推荐概述

美团2015年上半年交易额为470亿!

美团交易额

0

125

250

375

500

2011 2012 2013 2014

交易额

推荐⾦金额占⽐比10%!

Page 6: 美团技术沙龙02 - 移动端O2O推荐的Online Learning实战

美团移动端O2O推荐概述

其他: 购买完成,评价完成,搜索⽆无结果,附近团购,相关团购

Page 7: 美团技术沙龙02 - 移动端O2O推荐的Online Learning实战

O2O推荐的特点

望京

电影美⾷食休闲

1. 位置和时间:决定因素

2. ⽤用户兴趣:重要因素 3.评论和社交:辅助因素推荐系统

Page 8: 美团技术沙龙02 - 移动端O2O推荐的Online Learning实战

⺫⽬目录

2.美团推荐系统介绍

4.计划与展望

1.美团移动端O2O推荐概述

3. Online Learning重排序

Page 9: 美团技术沙龙02 - 移动端O2O推荐的Online Learning实战

推荐系统介绍 输出

数据⽣生成

数据存储

触发

规则过滤

重排序

过滤

etl spark storm kafka

hive hbase mysql redis

协同过滤 location-based

query- based

cold start

online learning GBDT

Page 10: 美团技术沙龙02 - 移动端O2O推荐的Online Learning实战

推荐系统介绍移动端排序作⽤用更加突出

移动端pc端

位置变少

Page 11: 美团技术沙龙02 - 移动端O2O推荐的Online Learning实战

⺫⽬目录

2.美团推荐系统

4.计划与展望

1.美团移动端O2O推荐概述

3.Online Learning重排序

Page 12: 美团技术沙龙02 - 移动端O2O推荐的Online Learning实战

模型

预测样本X 展⽰示 反馈Y

训练

Online Learning流程

实时快速迭代 快速反映线上变化

Page 13: 美团技术沙龙02 - 移动端O2O推荐的Online Learning实战

Online Learning重排序为什么要做Online Learning 重排序

context:事件、热点

user: ⽤用户兴趣不断变化⽕火锅

电影酒店

item:商家线下情况不断变化

主席套餐

排队、客满、冲突、突然优惠

每次打开美团需求都可能不⼀一样

节⽇日、名⼈人效应、热映电影

⼤大圣归来七⼣夕鲜花

突然优惠

Page 14: 美团技术沙龙02 - 移动端O2O推荐的Online Learning实战

Online Learning的架构

kafka

session聚合

label match

label match

hbase

特征抽取特征预处理模型训练medis

展⽰示流

点击流

下单流

写⼊入

读写

读写

预测

展⽰示

展⽰示

点击

下单

Page 15: 美团技术沙龙02 - 移动端O2O推荐的Online Learning实战

训练样本⽣生成数据清洗

点击/下单

训练样本

丢弃

12

3

4

5

6

7

8

9

n

每屏只展⽰示四个单⼦子

⽤用户看的第⼏几个?

skip above+2

Page 16: 美团技术沙龙02 - 移动端O2O推荐的Online Learning实战

特征user item context

id类:userid

画像: 性别 年龄

⾏行为:点过 买过

id类:单⼦子 品类

描述:店名 title

评论:评分 标签

位置:距离 商圈

时间: ⼩小时 星期

天⽓气:温度 ⾬雨晴

Page 17: 美团技术沙龙02 - 移动端O2O推荐的Online Learning实战

Online Learning模型Online Learning 训练过程:

样本(X,Y)

θ = argmin f(θ|X,Y)

参数θ 挑战:需要快速求出最优解,

最好是有解析解

通常两种⽅方式:

Bayesian Online Learning

Follow The Regularized Leader

Page 18: 美团技术沙龙02 - 移动端O2O推荐的Online Learning实战

样本(X,Y)

计算后验 p(θ|X,Y)

给定先验p(θ)

Bayesian Online Learning Example:

Online Learning模型

最终结果:

Page 19: 美团技术沙龙02 - 移动端O2O推荐的Online Learning实战

Bayesian Probit Regression:

Online Learning模型

Page 20: 美团技术沙龙02 - 移动端O2O推荐的Online Learning实战

Follow The Regularized Leader

上⾯面的等式没有解析解,但是,如果f(w)是凸的,就可以转化成下⾯面的等式。

Online Learning模型

Page 21: 美团技术沙龙02 - 移动端O2O推荐的Online Learning实战

下单率预测的损失函数:

其中:

Follow The Regularized Leader

是凸函数

Online Learning模型

Page 22: 美团技术沙龙02 - 移动端O2O推荐的Online Learning实战

Online Learning模型利⽤用点击信息

点击也代表了⽤用户的意愿,不能完全作为负样本

损失函数:

点击: Ni=1下单: Ni=10

Page 23: 美团技术沙龙02 - 移动端O2O推荐的Online Learning实战

Online Learning模型FTRL vs BPR

FTRL BPR

需要更多训练样本 需要更少的训练样本

稀疏性好 没有稀疏性

参数难调 参数容易调

线下对⽐比策略上线

Page 24: 美团技术沙龙02 - 移动端O2O推荐的Online Learning实战

FTRL线上表现base

ftrl

下单权重:10   -> 100

base

ftrl

-7%

-2%

Page 25: 美团技术沙龙02 - 移动端O2O推荐的Online Learning实战

FTRL线上表现

特征:

base

ftrl

+1.5%

geo -hash 最近看过此品类的⽐比例 cvr

参数:调整参数

问题:groupAUC MAP指标⽐比较低

Page 26: 美团技术沙龙02 - 移动端O2O推荐的Online Learning实战

Online Learning模型Pair-Wise 模型

order > click

click > impression

LambdaRank

损失函数

pair ⽣生成

其中:

click > earlier click ?

Page 27: 美团技术沙龙02 - 移动端O2O推荐的Online Learning实战

Online Learning模型

1.概率结合

2. ⺫⽬目标函数结合

结合Point-Wise 和 Pair-Wise

依概率选择做point-wise 还是pair-wise

对于⼀一个session的训练数据

第k个session的损失函数

Page 28: 美团技术沙龙02 - 移动端O2O推荐的Online Learning实战

FTRL线上表现

+5%

base

ftrl

Page 29: 美团技术沙龙02 - 移动端O2O推荐的Online Learning实战

计划与展望

其他场景的数据

更加丰富的埋点

场景模型

整合数据

因⼦子模型

多模型融合

exploit/explore

多样性

训练数据 特征 模型 线上

Page 30: 美团技术沙龙02 - 移动端O2O推荐的Online Learning实战