11
IMAMASU Ryohei Jubatus Hackathon w/ 読読読読 #2 2016-11-12, 13

JUBARHYME

Embed Size (px)

Citation preview

Page 1: JUBARHYME

IMAMASU Ryohei

Jubatus Hackathon w/ 読売新聞 #22016-11-12, 13

Page 2: JUBARHYME

2

韻を踏む[ インヲフム ]

Page 3: JUBARHYME

3

Jubatus[yu ba ta su]

そばかす[so ba ka su]

Page 4: JUBARHYME

4

読売新聞社の膨大な言語データをJubatus を使って分析し、

共起性の高い言葉を使って韻を踏む

Page 5: JUBARHYME

5

日本シリーズは日ハムが優勝チャンスで大仕事、中田翔

こんな感じ

単に韻を踏むだけではなくて、関連性の高い情報を使って韻を踏む

実は、韻を踏むだけのサービスは、意外にたくさん転がってた

単なる単語辞書(コーパス)ではなく、読売新聞さんの記事だから可能

Page 6: JUBARHYME

将来的なサービスイメージ

ヘイ ! メ〜ン ! 本日のおすすめ記事だぜ !

【速報】アメリカ大統領戦 接戦にセレブも熱視線 !

【速報】アメリカ大統領戦

アメリカ大統領選挙が 11 月 8 日(現地)に投開票され、 AP など現地メディアの報道によると、 [ 続きを読む ]

ニュース配信にアクセントを !

Page 7: JUBARHYME

7

入力 : 韻を踏みたい単語

記事データ

① 単語に対して類似性の高い記事を検索

類似度の高い記事

出力 : 入力に対して、共起性が高く、韻を踏んでる単語

② 入力単語に対して、韻を踏んでる単語を検索

韻を踏むための処理概要

Page 8: JUBARHYME

8

アーキテクチャ( Web AP )

Web AP

(Python)

Flask

jubarecommender

記事データ

事前に 3 年分の記事を学習類似度の高い記事を問い合わせ

PythonClient

JUMAN++

記事から単語を抽出、読み仮名の取得

EmbbededPython

jubarecommender抽出した単語を学習させ、韻を踏む単語を取得

Web Speech

API

Page 9: JUBARHYME

9

デモチェケラ !

Page 10: JUBARHYME

10

• 入力された最後の単語だけで韻を踏むのはなんとなくできたけど、自然な文章を生成する処理まではできてません

• 類似性が高い記事を抽出して、フィルタをかけているので、韻を踏める単語が不足がち• 「活用度」に対して「度」のような、最後の 1 文字の部分一致だけ

が出てきて悲しい

• どの品詞を使うか、類似記事の推薦部分、韻を踏むポイント(語尾、語頭、真ん中)など、自然言語の部分はチューニングできそう

• ラップ難しい

感想・まとめ

Page 11: JUBARHYME

11

•まずは、それっぽい文章を作る•インタフェースをボットにする•掛け合い•曲にのせる

展望