Upload
medku
View
357
Download
1
Embed Size (px)
DESCRIPTION
20130727 niconico data meeting 2nd http://atnd.org/event/nicogakkaidata2
Citation preview
リズムゲーム楽曲属性予測問題
20130727 Lightning Talk第二回ニコニコ学会 β データ分析研究会 @( 株 ) ドワンゴ
YF@Med_KU
本日の内容
ラブライバーが統計学の使い方を誤るとこうなる
機械学習による予測
声優統計の紹介声優統計第二号 (8/10 土 ) 東ノ 46b
海未ちゃんブヒィ !!!
クール
・・・
クール
スマイル
・・・
クール
スマイル
ピュア
・・・
クール
スマイル
ピュア
これって予測できんじゃね ??
候補楽曲元気が出る歌 ??愛の歌 ??情熱的な歌 ??爽快な歌 ??
候補楽曲元気が出る歌 ??愛の歌 ??情熱的な歌 ??爽快な歌 ??
候補楽曲 属性元気が出る歌 ??
スマイル (S)?? ピュア(P)??
愛の歌 ?? ピュア (P)??
情熱的な歌 ?? スマイル (S)??
爽快な歌 ?? クール (C)??
どうするよ ??スタッフたち
候補楽曲元気が出る歌 ??愛の歌 ??情熱的な歌 ??爽快な歌 ??
候補楽曲 属性元気が出る歌 ??
スマイル (S)?? ピュア(P)??
愛の歌 ?? ピュア (P)??
情熱的な歌 ?? スマイル (S)??
爽快な歌 ?? クール (C)??
どうするよ ??スタッフたち
P さん
じゃ、それで。常識的に考えて。
候補楽曲元気が出る歌 ??愛の歌 ??情熱的な歌 ??爽快な歌 ??
候補楽曲 属性元気が出る歌 ??
スマイル (S)?? ピュア(P)??
愛の歌 ?? ピュア (P)??
情熱的な歌 ?? スマイル (S)??
爽快な歌 ?? クール (C)??
どうするよ ??スタッフたち
P さん
じゃ、それで。常識的に考えて。
ここを定量化する
トピックモデルとは文書集合の生成モデル
楽曲 1
D :歌詞全体の集合N : D 内で使用される言葉全体の集合
好き
嫌い
アニメ
声優
生物
医学
命世界
歌現実
偽物消える
時間
かわいい死
強い
気持ち想い理想あなた
わたし
音
みんな
弱い
恋
K : N 内の言葉から生成されるトピック
・・・
Dirichlet で Gibbs なサンプリング (ggrks)
トピック 1あなた
恋好き想い
出会い
トピック 2消える
死ぬ別れ
終わりさようなら
トピック 3初めて
言葉歌
時間わたし
トピック kNGS発現
遺伝子医学解析
MeCab で品詞分解
予測
楽曲 1 :トピック 1 が , トピック 2 が , …, トピック K が → スマイル(S)
楽曲 個 トピック個
楽曲 n :トピック 1 が , トピック 2 が , …, トピック K が → クール (C)
・・ ・
楽曲 2 :トピック 1 が , トピック 2 が , …, トピック K が → ピュア (P)
細けぇこたぁいいんだお !!
分類器の作成 → 未知楽曲の属性予測
結果C P S
C 5 0 2
P 5 2 0
S 1 0 6
PredictionSc
h Fe
s
7/1 追加 クール (C)↓
予測はクール (C)
7/1 追加 スマイル(S)
↓予測はスマイル (S)
7/19 追加 スマイル (S)↓
予測はクール (C)
No brand girls ススメ→トゥモロウ Love marginal
クール (C) と スマイル (S) の推定精度は高いが、ピュア (P) の推定精度は悪い。
まとめ
歌詞から特徴量を抽出して、スクフェスの楽曲属性予測を行った。
ピュア楽曲の推定が甘かった。
声優統計にぜひとも来てください。声優統計第二号 (8/10 土 ) 東ノ 46b