Upload
jubatusofficial
View
4.153
Download
4
Embed Size (px)
Citation preview
IMAMASU Ryohei
Jubatus Hackathon w/ 読売新聞 #22016-11-12, 13
2
韻を踏む[ インヲフム ]
3
Jubatus[yu ba ta su]
そばかす[so ba ka su]
4
読売新聞社の膨大な言語データをJubatus を使って分析し、
共起性の高い言葉を使って韻を踏む
5
日本シリーズは日ハムが優勝チャンスで大仕事、中田翔
こんな感じ
単に韻を踏むだけではなくて、関連性の高い情報を使って韻を踏む
実は、韻を踏むだけのサービスは、意外にたくさん転がってた
単なる単語辞書(コーパス)ではなく、読売新聞さんの記事だから可能
将来的なサービスイメージ
ヘイ ! メ〜ン ! 本日のおすすめ記事だぜ !
【速報】アメリカ大統領戦 接戦にセレブも熱視線 !
【速報】アメリカ大統領戦
アメリカ大統領選挙が 11 月 8 日(現地)に投開票され、 AP など現地メディアの報道によると、 [ 続きを読む ]
ニュース配信にアクセントを !
7
入力 : 韻を踏みたい単語
記事データ
① 単語に対して類似性の高い記事を検索
類似度の高い記事
出力 : 入力に対して、共起性が高く、韻を踏んでる単語
② 入力単語に対して、韻を踏んでる単語を検索
韻を踏むための処理概要
8
アーキテクチャ( Web AP )
Web AP
(Python)
Flask
jubarecommender
記事データ
事前に 3 年分の記事を学習類似度の高い記事を問い合わせ
PythonClient
JUMAN++
記事から単語を抽出、読み仮名の取得
EmbbededPython
jubarecommender抽出した単語を学習させ、韻を踏む単語を取得
Web Speech
API
9
デモチェケラ !
10
• 入力された最後の単語だけで韻を踏むのはなんとなくできたけど、自然な文章を生成する処理まではできてません
• 類似性が高い記事を抽出して、フィルタをかけているので、韻を踏める単語が不足がち• 「活用度」に対して「度」のような、最後の 1 文字の部分一致だけ
が出てきて悲しい
• どの品詞を使うか、類似記事の推薦部分、韻を踏むポイント(語尾、語頭、真ん中)など、自然言語の部分はチューニングできそう
• ラップ難しい
感想・まとめ
11
•まずは、それっぽい文章を作る•インタフェースをボットにする•掛け合い•曲にのせる
展望