Upload
takahashi-kanji
View
50
Download
1
Embed Size (px)
Citation preview
文献について
•Paraphrasing Adaptation for Web Search Ranking
•Chenguang Wang, Nan Duan, Ming Zhou, Ming Zhang, 2013, Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics (Volume 2: Short Papers), pp.41-46
はじめに
•換言とは、入力文に対して別の表現で伝えること
•Web検索では、検索クエリに対して同じ意味でも表現が違うと、うまく検索できない。• X is the author of Y
• Y was written by X
•そこで、Web検索に特化した換言を深く調査する
Web検索のための換言
•換言知識の取得•バイリンガルコーパスから取得(Callison-Burch 2005)•分布仮説によりモノリンガルコーパスから取得(Lin and
Pantel 2001)• WordNetから取得(Miller 1995)
•換言に3つの手法を用いる•検索指向の換言モデル• NDCGベースのパラメータ最適化•強化したランキングモデル
検索に適応した換言モデル
•統計的機械翻訳と同様の考え方•入力クエリQに対して、線形モデルにより換言候補を列挙する𝑄 = arg max
𝑄′∈ℋ(𝑄)𝑃 𝑄′ 𝑄)
= arg max𝑄′∈ℋ(𝑄)
𝑚=1𝑀 𝜆𝑚ℎ𝑚(𝑄, 𝑄′)
• HはQに対するすべての換言候補• Q’はQに対する候補• 𝜆𝑚とℎ𝑚は素性に対する重みづけ
強化したランキングモデル
•Web検索においては、クエリに関連する文書のランク付けを行うことが重要
•Qはクエリ、Dはドキュメントセット、Fは一致素性
ℛ 𝑄,𝐷𝑄 =
𝑘=1
𝐾
𝜆𝑘𝐹𝑘(𝑄, 𝐷𝑄)
実験
•換言対を580万文取得
•検索エンジンのログから無作為に抽出した2838のクエリをアノテーション• 1419をパラメータ学習、残りをテストセットとして利用
•NDCG@1を用いて評価• Web検索タスクの評価手法
ベースラインシステム
•換言のベースライン:BL-Para•伝統的な統計的機械翻訳の素性のみを用いる
• 重みづけにBLEU評価を用いたMERTを用いる
•ランク付けのベースライン:BL-Rank•もとのクエリと、Webページの内容を使用し、SVM-rank toolkitでモデルを学習