Upload
ethan-tsui
View
2.258
Download
6
Embed Size (px)
DESCRIPTION
以BOOK11.com的從web log資料整理/分析 進行網站改善以及了解使用者在網站的行為 得到的效益經驗分享, 包含 Clickstream分析、訂單來源分析、以及簡易的分析點選來源的作法等等。
Citation preview
www.book11.com
電子商務 Big Data處理與分析實際效益分享
BOOK11.com 技術長 暨 共同創辦人Ethan Yin-Hao Tsui
崔殷豪
www.book11.com
2
關於 Ethan Tsui
• 資訊工程所 碩士• 中研院資訊科學所
– 大量(生物資訊)資料分析、寫軟體、管理近百台伺服器– 發表數篇國際期刊論文,
其一為全台第一篇 純軟體 發表於 SCI 純生命科學期刊 (Molecular & Cellular Proteomics, impact factor: 8.35)
• 全國大專院校資訊專題競賽 第一名• 題目是 個人化服務新聞網站,用類神經網路學習使用者喜好
• 全國程式設計競賽 第一名
• SOHO 接案超過二十個專案
www.book11.com
3
關於 BOOK11.com
• 2009 年 6 月一起成立 BOOK11.com– 台灣第一個提供完整服務之電子書平台– 日本兩大電子書平台指定合作– 強調讀者閱讀體驗、提供好的服務
• 提供電子書內容販售與製作– 書籍(小說、一般書)、漫畫、雜誌、寫真
• HTML5 線上閱讀 ( 只需瀏覽器 ) 、下載離線閱讀 (apps, PC)– 支援 iPad 、 iPhone 、 Android Phone/Pad 、 Chrome 、 Firefox 、 IE 9
• 採用 Hadoop 儲存大量電子書檔案及 HBase 儲存分析資料
www.book11.com
4
經營電子商務 - 為何要進行資料分析• 有什麼可貴的價值藏在資料裡嗎?
• 可以增加收入嗎!?
• 可以節省人力、金錢成本嗎!?
• 可以增加客戶忠誠度、黏性、認同感嗎!?
www.book11.com
5
電子商務網站資料處理分析
Clickstream
商品點選來源 訂單來源分析
改善網站介面
行銷效益分析
使用者分群
提升訂單達成率
推薦系統
增強客戶黏性 個人化服務
使用者喜好分析
瀏覽歷程
交易資料
回文與評分
使用者喜好 Profile
收集資料
Web log
整理資料 分析資料
…… …
www.book11.com
網站資料收集 / 整理 / 分析
www.book11.com
7
網站資料收集 / 分析• 竭盡所能的先 Log
– Web log 、 Action log 、畫面瀏覽 log 、…• 資料先寫檔案,再批次進 HBase 等分散式資料庫• 或採用 Sampling 方法,進行抽樣
• 如何分析…– DIY
– Hire 資料科學家 (“They need to find nuggets of truth in data and then explain it to the business leaders.”)[http://tech.fortune.cnn.com/2011/09/06/data-scientist-the-hot-new-gig-in-tech/ ]
– 委外分析– 現有 solution / tools
www.book11.com
8
商品點選來源 (ref 參數 )• 將每一個導向商品資訊頁的連結,
加上參數 : ref=來源
新書上架
ABC
編輯推薦
AD
首頁
商品資訊頁
A
ref= 首頁 _ 新書上架
ref= 首頁 _ 編輯推薦
商品分類頁生活勵志類
A
E
F
商品分類商品分類
活動頁
搜尋
電子報
www.book11.com
9
ref 範例
www.book11.com
10
商品點選來源的比例
首頁7%
分類頁19%
商品介紹頁38%
搜尋7%
活動頁5%
電子報0%
其它24%
www.book11.com
11
商品點選來源的效益• 簡易且精確的知道各來源比例
• 可用來評估促銷活動、活動網頁、電子報的曝光效益
• 可用來知道網站各功能的使用情況
• 可找出網站瀏覽熱點
www.book11.com
12
新商品銷售量增加 3倍• 過去書籍介紹佔比約 22% (當時佔比最高)
• 將【新書上架】改放在書籍介紹頁,新書在上架一個禮拜內的平均 (Trimmed-mean)銷售量增加
3倍
• 現在書籍介紹佔比更提升至 38.4%
www.book11.com
Clickstream ( 點擊流 ) 分析
www.book11.com
14
Clickstream ( 點擊流 ) 分析• 顧客動線
• 訂單來源分析
• 使用者喜好分析
• 使用者行為預測
• 更多更多更多更多其他分析
www.book11.com
15
Clickstream 資料範例
首頁 書籍 A 生活勵志類 書籍 B 書籍 C
書籍 D購買書籍 D
from: http://blogs.citypages.com/gimmenoise/happy.web.user.jpg
www.book11.com
16
首頁 書籍介紹 分類 購買 線上
閱讀線上試讀 …
首頁書籍介紹分類
購買
線上閱讀線上試讀…
( 下一頁 )
(目前
頁)
首頁 書籍 A 生活勵志類 書籍 B 書籍 C
書籍 D 購買書籍 D
Clicksream
上下頁統
計
首頁 書籍 A
1
首頁 書籍 A分類 -
生活勵志類
首頁
1
書籍 B書籍 A分類 -
生活勵志類
分類
書籍介紹
1
www.book11.com
17
首頁 書籍介紹 分類 購買 線上
閱讀線上試讀 …
首頁書籍介紹分類
購買
線上閱讀線上試讀…
( 下一頁 )
(目前
頁)
首頁 書籍 A 生活勵志類 書籍 B 書籍 C
書籍 D 購買書籍 D
Clicksream
上下頁統
計
首頁 書籍 A
1
首頁 書籍 A分類 -
生活勵志類
書籍介紹
首頁
1
書籍 B書籍 A分類 -
生活勵志類
, 分類
書籍介紹
1
書籍 C書籍 B分類 -
生活勵志類
分類
1
書籍 D
書籍 C書籍 B
2
購買書籍 D書籍 D
書籍 C
,
1
分類
www.book11.com
18
顧客動線圖
www.book11.com
19
首頁調整後,顧客動線圖
www.book11.com
訂單來源分析
www.book11.com
21
點的多,一定貢獻多 !?
• 貢獻:交易( $$$$$ )
• 實際經驗,某一活動,點選多達 99,999 次 (曝光率高 )
但透過該活動達成訂單的卻只有 500 次 (購買率低 )
• 購買率是一個參考指標500/99,999 => 0.5%
www.book11.com
22
訂單來源分析• 透過 Clickstream 資料
• 準確地評估活動或廣告帶來的效益– Y廣告、 G廣告、 F廣告、社群網站、…
• 評估網站功能效益– 電子報、活動網頁、排行榜、…
www.book11.com
23
訂單來源分析 –假設情境
電子報 書籍 A 書籍 B 離開
首頁 搜尋 書籍 A 購買書籍 A
某會員,某日從電子報看到書籍 A…
一天後,
?
?
www.book11.com
24
訂單來源分析 – 第一次來源分析
來源 購買率
首頁 0.8%
分類頁 3.8%
商品介紹頁 2.7%
搜尋 1.9%
活動頁 0.3%
電子報 0.0%
首頁 , 2.3%
分類頁 , 28.8%
商品介紹頁 ,40.4%
搜尋 , 5.5%
活動頁 , 0.6%
電子報 , 0.0%
其它 , 22.4%
www.book11.com
商品推薦系統
www.book11.com
26
商品推薦系統• 買了此商品的人也買了
• 看了此商品的人也看了
• 分類推薦
• 個人化推薦
www.book11.com
27
系統推薦 訂單貢獻/購買率來源 區塊 訂單貢獻比 購買率
首頁 2.3% 0.8%
分類頁 28.8% 3.8%
商品介紹頁 40.4% 2.7%
系統推薦 12.2% 2.0%
非系統推薦 28.2% 5.7%
線上閱讀 下一集 6.1% 46.0%
推薦 1.0% 2.7%
搜尋 5.5% 1.9%
活動頁 0.6% 0.3%
電子報 0.0% 0.0%
www.book11.com
28
透過資料觀察得到的效益
系統推薦佔訂單貢獻 13.2%
透過資料觀察,衍生出的功能一共佔訂單貢獻 19. 3%
而這些功能帶來的收入 將近 25%
www.book11.com
結論
www.book11.com
30
總結 –電子商務進行資料分析可以…• 增加銷售
– 調整網站動線設計
– 提升產品曝光率
– 增強使用者黏性
www.book11.com
31
總結 –電子商務進行資料分析可以…• 節省成本
– 評估行銷效益,調整下次行銷策略
– 評估功能運作效益,將資源放在最佳的地方
www.book11.com
32
總結 –電子商務進行資料分析可以…• 深植『服務』
– 以每個客戶為中心的個人化服務
– 了解客戶喜好,做更精準的服務
– 依照既有的客戶喜好分群,服務新的客戶
www.book11.com
33
結論• 電子商務進行資料分析可以有效的
– 增加收入– 節省人力、金錢成本– 增加客戶忠誠度、黏性、認同感
• 但要注意『錯誤資料 -> 錯誤結論 -> 錯誤決策 ->
$$浪費、客戶流失』
• 大量非結構化 / 結構化資料分析需要– 強力的正確分析,提供更為精準的結果、推薦與預測– 強大的運算機制,提供接近即時的報表,供快速反應
www.book11.com
34
黃金就在 data 裡,就看你怎麼挖 ?
from: http://www.gamineral.org/t04-carlysle-summit-mines.html http://www.museum.mtu.edu/Gallery/gold.html
logdata
log
data
data