美团技术沙龙02 - 移动端O2O推荐的Online Learning实战

移动端O2O推荐的Online Learning实战

孔东营

个⼈人介绍

孔东营

2010 － 2013 中科院计算所硕⼠士研究⽣生

2013 － 2014 ⺴⽹网易有道⼲⼴广告算法⼯工程师

2015 －今天美团推荐算法⼯工程师

⺫⽬目录

2.美团推荐系统介绍

4.计划与展望

1.美团移动端O2O推荐概述

3.Online Learning 重排序

⺫⽬目录

4.计划与展望

3.Online Learning 重排序

美团移动端O2O推荐概述

美团2015年上半年交易额为470亿！

美团交易额

2011 2012 2013 2014

交易额

推荐⾦金额占⽐比10%！

美团移动端O2O推荐概述

其他：购买完成，评价完成，搜索⽆无结果，附近团购，相关团购

O2O推荐的特点

望京

电影美⾷食休闲

1. 位置和时间：决定因素

2. ⽤用户兴趣：重要因素 3.评论和社交：辅助因素推荐系统

⺫⽬目录

4.计划与展望

3. Online Learning重排序

推荐系统介绍输出

数据⽣生成

数据存储

触发

规则过滤

重排序

过滤

etl spark storm kafka

hive hbase mysql redis

协同过滤 location-based

query- based

cold start

online learning GBDT

推荐系统介绍移动端排序作⽤用更加突出

移动端pc端

位置变少

⺫⽬目录

2.美团推荐系统

4.计划与展望

3.Online Learning重排序

模型

预测样本X 展⽰示反馈Y

训练

Online Learning流程

实时快速迭代快速反映线上变化

Online Learning重排序为什么要做Online Learning 重排序

context：事件、热点

user: ⽤用户兴趣不断变化⽕火锅

电影酒店

item：商家线下情况不断变化

主席套餐

排队、客满、冲突、突然优惠

每次打开美团需求都可能不⼀一样

节⽇日、名⼈人效应、热映电影

⼤大圣归来七⼣夕鲜花

突然优惠

Online Learning的架构

session聚合

label match

特征抽取特征预处理模型训练medis

展⽰示流

点击流

下单流

写⼊入

读写

预测

展⽰示

点击

下单

训练样本⽣生成数据清洗

点击／下单

训练样本

丢弃

每屏只展⽰示四个单⼦子

⽤用户看的第⼏几个？

skip above＋2

特征user item context

id类：userid

画像: 性别年龄

⾏行为：点过买过

id类：单⼦子品类

描述：店名 title

评论：评分标签

位置：距离商圈

时间：⼩小时星期

天⽓气：温度⾬雨晴

Online Learning模型Online Learning 训练过程:

样本（X,Y）

θ = argmin f(θ|X,Y)

参数θ 挑战：需要快速求出最优解，

最好是有解析解

通常两种⽅方式：

Bayesian Online Learning

Follow The Regularized Leader

样本（X,Y）

计算后验 p(θ|X,Y)

给定先验p(θ)

Bayesian Online Learning Example：

Online Learning模型

最终结果：

Bayesian Probit Regression：

上⾯面的等式没有解析解，但是，如果f(w)是凸的，就可以转化成下⾯面的等式。

下单率预测的损失函数：

其中：

是凸函数

Online Learning模型利⽤用点击信息

点击也代表了⽤用户的意愿，不能完全作为负样本

损失函数：

点击： Ni=1下单： Ni=10

Online Learning模型FTRL vs BPR

FTRL BPR

需要更多训练样本需要更少的训练样本

稀疏性好没有稀疏性

参数难调参数容易调

线下对⽐比策略上线

FTRL线上表现base

下单权重：10 -> 100

FTRL线上表现

特征：

＋1.5%

geo -hash 最近看过此品类的⽐比例 cvr

参数：调整参数

问题：groupAUC MAP指标⽐比较低

Online Learning模型Pair－Wise 模型

order > click

click > impression

LambdaRank

损失函数

pair ⽣生成

其中：

click > earlier click ?

1.概率结合

2. ⺫⽬目标函数结合

结合Point-Wise 和 Pair-Wise

依概率选择做point－wise 还是pair－wise

对于⼀一个session的训练数据

第k个session的损失函数

FTRL线上表现

计划与展望

其他场景的数据

更加丰富的埋点

场景模型

整合数据

因⼦子模型

多模型融合

exploit/explore

多样性

训练数据特征模型线上

美团技术沙龙02 - 移动端O2O推荐的Online Learning实战

Engineering

阿里巴巴 O2O — 战略的实战

美团技术沙龙02 - O2O排序解决方案

O2O : IoT의 출발점_한경 MFC 발표 자료

ANALISIS KUADRAN STRATEGI ONLINE TO OFFLINE (O2O) …repository.uinjkt.ac.id/dspace/bitstream/123456789... · i ANALISIS KUADRAN STRATEGI ONLINE TO OFFLINE (O2O) COMMERCE SERVICE

O2O品牌推广平台——O2O营销方式的新方案-Alexis Wong

O2O-Emmanuel Sabbagh(Ch)

EС market B2B Ukaine databank demoversion O2O VPN IP

本地生活 O2O 行业竞争力分析报告¸‡擎O2O研究 … · 1.2 分析框架在本地生活o2o 中，电影、餐饮和打车是与消费者生活最密切的o2o 服务，

効果を視える化する O2O ソリューションexpo.nikkeibp.co.jp/msw/2012/download/pdf/B32.pdfEC黎明期 EC普及期 O2O黎明期 O2O普及期 1994 Amazon.com誕生 1997

2016年6月9日/星期四 “水龙”腾“天龙”翔“地龙”舞xmwb.xinmin.cn/resfile/2016-06-09/A14/A14.pdf“水龙”腾“天龙”翔“地龙”舞!三龙"齐聚市学生龙文化全能赛今举行!!!!端午节，第三届上海市学生龙文化全能

IWOM watch 2012 compilation_lbs&o2o (Part 2)

세상을 연결하는 모바일 O2O- onefinedinner 발표문_20151214

echoss Smart Stmap€¦ · O2O Marketing O2O Commerce O2O Payment • 電子ハンコや承認サーバ、SDKで構成されたO2O ... • Ticketing, Social Commerce Quick Pass

O2O, 커머스를 넘어 On-Demand Economy로

O2O & Fintech

O2O 배달서비스의 기술 혁신기업 요기요 (YOGIYO) 서우석 부사장

點點，為行動而生的 O2O App

O2O 비즈니스모델과 국내외 사례(박서기)

知我科技(836435) O2O

O2Oクラウドサービス MOCA_iOS_SDK