8
DEIM Forum 2015 G7-6 Twitter を利用した観光ルート推薦の一手法 新井 晃平 新妻 弘崇 †† 太田 ††† 岡山大学工学部情報系学科 700-8530 岡山県岡山市北区津島中 3-1-1 †† ,††† 岡山大学大学院自然科学研究科 700-8530 岡山県岡山市北区津島中 3-1-1 E-mail: [email protected], ††[email protected], †††[email protected] あらまし Twitter に代表されるマイクロブログの普及に伴い,今日では様々な情報が発信されている.それらの情 報の中には,Twitter ユーザ自身が実際にどのような場所を訪れ,どのような体験をしたかといった観光体験情報も 多く存在する.実際の観光体験に基づくこれらの情報は,これから観光する者にとって重要な情報源となる.そこで 本稿では,まず Twitter から実際の観光体験に基づいてつぶやかれたツイートを収集する.観光体験に関わるツイー トかどうかの判定には,旅行者のツイートに頻繁に現れる特徴や手がかり語の有無を利用する.そして,収集したツ イートを「食事」,「景観」,「行動」,「土産」の 4 つのカテゴリに分類し,それらの結果を用いて観光ルートを推薦する 手法を提案する.実験では,人手で判定した正解データとの比較により観光ツイートの抽出精度と分類精度を評価し た.また,推薦した観光ルートを分析し,その有効性について考察した. キーワード マイクロブログ,Twitter,観光情報,ルート推薦 1. はじめに Twitter (注1は,ツイートと呼ぶ 140 文字以内の短文を投稿・ 閲覧することによってユーザ間のコミュニケーションを図るこ とができるマイクロブログサービスであり,今日では,何気な い発言からニュース速報に至るまで,幅広い情報が発信されて いる.それらの情報の中には旅行者が実際に,どのような場 所で,どのような体験をしたかといった観光に関する体験情 報を記したツイートも数多く存在する.また,Twitter と連携 できる Foursquare (注2などの位置情報に基づいたサービスや Instagram (注3のような画像共有サービスも登場し,ユーザの 位置情報や体験情報が発信されている. 実際の観光体験に基づいてつぶやかれたツイートには,現地 を訪れた時刻や現地の様子,景観に対する感想など,観光に おける重要な情報が含まれる.しかし,Twitter には無数のツ イートが存在するため,観光体験に基づく情報のみを収集し, 利用することは容易ではない.そこで中嶋ら [1] は,観光体験 に関わるツイートの収集に,旅行者のツイートに頻繁に現れる 特徴と Foursquare Instagram などのサービスを利用した. そして収集したツイートをカテゴリ分類し,その結果を用いて 旅行者の好みに合わせた観光ルートを推薦する手法を提案した. 中嶋らは,位置情報が付与されたツイートと本文に「なう」 を含むツイートのみを対象に,観光スポット周辺でリアルタイ ムにつぶやかれたツイートの収集と分類を行ったが,位置情報 が付与されていないツイートの中にも観光体験に関わるツイー トは数多く存在する.また,中嶋らは観光スポットでの過去の 体験についてつぶやかれたツイートを収集対象としていないた (注1):Twitterhttp://twitter.com/ (注2):Foursquarehttps://ja.foursquare.com/ (注3):Instagramhttp://instagram.com/ め,観光情報の取りこぼしが多い. さらに,中嶋らの手法では Twitter ユーザのタイムラインからのみ観光スポットを収集す るため,得られる観光スポットが少ないという問題がある.そ こで本研究では,あらかじめ観光スポットを収集し,その一覧 を生成する.また,本研究では位置情報の有無に関わらず全て のツイートを対象に観光ツイートを収集し,分類する.そして, それらのツイートに含まれる観光情報を用いて観光ルートを推 薦する手法を提案する.なお,本稿において,観光スポットと は観光名所や店のことを指し,実際の観光体験に基づいてつぶ やかれたツイートのことを観光ツイートと呼ぶ. 本稿の構成は次の通りである.まず 2. 節で関連研究につい て述べ,3. 節で提案する観光ルート推薦システムの概要を述べ る.次に 4. 節で観光スポット一覧の提示方法について説明し, 5. 節で推薦ルートの決定方法について述べる.そして,6. 節で 提案手法に対する評価実験を行い,最後に 7. 節で本研究のまと めと今後の課題について述べる. 2. 関連研究 中嶋ら [1] は位置情報付きツイートを用いて,観光ルートを 推薦する手法を提案した.彼らは旅行者のツイートに頻繁に現 れる特徴と Foursquare Instagram のサービスを用いて観光 スポットでつぶやかれたツイートを収集し,そのユーザのタイ ムラインから観光ルートを抽出した.また,収集したツイート を,手がかり語や品詞の特徴から「食事」, 「景観」, 「行動」の 3 つのカテゴリに分類し, その結果を用いて観光ルートを推薦 した.中嶋らの手法では,Twitter ユーザのタイムラインから のみ観光スポットを収集しているため,得られる観光スポット が少ない.そこで本研究では,あらかじめ観光スポットを収集 する手法を提案する.また,中嶋らは位置情報が付与されたツ イートと本文に「なう」を含むツイートのみを対象にして,観 光スポットでリアルタイムにつぶやかれたツイートを収集した

Twitter を利用した観光ルート推薦の一手法 - IPSJ …DEIM Forum 2015 G7-6 Twitter を利用した観光ルート推薦の一手法 新井 晃平y 新妻 弘崇yy 太田

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Twitter を利用した観光ルート推薦の一手法 - IPSJ …DEIM Forum 2015 G7-6 Twitter を利用した観光ルート推薦の一手法 新井 晃平y 新妻 弘崇yy 太田

DEIM Forum 2015 G7-6

Twitter を利用した観光ルート推薦の一手法

新井 晃平† 新妻 弘崇†† 太田 学 †††

† 岡山大学工学部情報系学科 〒 700-8530 岡山県岡山市北区津島中 3-1-1

†† ,†††岡山大学大学院自然科学研究科 〒 700-8530 岡山県岡山市北区津島中 3-1-1

E-mail: †[email protected], ††[email protected], †††[email protected]

あらまし Twitter に代表されるマイクロブログの普及に伴い,今日では様々な情報が発信されている.それらの情

報の中には,Twitter ユーザ自身が実際にどのような場所を訪れ,どのような体験をしたかといった観光体験情報も

多く存在する.実際の観光体験に基づくこれらの情報は,これから観光する者にとって重要な情報源となる.そこで

本稿では,まず Twitter から実際の観光体験に基づいてつぶやかれたツイートを収集する.観光体験に関わるツイー

トかどうかの判定には,旅行者のツイートに頻繁に現れる特徴や手がかり語の有無を利用する.そして,収集したツ

イートを「食事」,「景観」,「行動」,「土産」の 4 つのカテゴリに分類し,それらの結果を用いて観光ルートを推薦する

手法を提案する.実験では,人手で判定した正解データとの比較により観光ツイートの抽出精度と分類精度を評価し

た.また,推薦した観光ルートを分析し,その有効性について考察した.

キーワード マイクロブログ,Twitter,観光情報,ルート推薦

1. は じ め に

Twitter(注1)は,ツイートと呼ぶ 140文字以内の短文を投稿・

閲覧することによってユーザ間のコミュニケーションを図るこ

とができるマイクロブログサービスであり,今日では,何気な

い発言からニュース速報に至るまで,幅広い情報が発信されて

いる.それらの情報の中には旅行者が実際に,どのような場

所で,どのような体験をしたかといった観光に関する体験情

報を記したツイートも数多く存在する.また,Twitter と連携

できる Foursquare(注2)などの位置情報に基づいたサービスや

Instagram(注3)のような画像共有サービスも登場し,ユーザの

位置情報や体験情報が発信されている.

実際の観光体験に基づいてつぶやかれたツイートには,現地

を訪れた時刻や現地の様子,景観に対する感想など,観光に

おける重要な情報が含まれる.しかし,Twitter には無数のツ

イートが存在するため,観光体験に基づく情報のみを収集し,

利用することは容易ではない.そこで中嶋ら [1]は,観光体験

に関わるツイートの収集に,旅行者のツイートに頻繁に現れる

特徴と Foursquare や Instagram などのサービスを利用した.

そして収集したツイートをカテゴリ分類し,その結果を用いて

旅行者の好みに合わせた観光ルートを推薦する手法を提案した.

中嶋らは,位置情報が付与されたツイートと本文に「なう」

を含むツイートのみを対象に,観光スポット周辺でリアルタイ

ムにつぶやかれたツイートの収集と分類を行ったが,位置情報

が付与されていないツイートの中にも観光体験に関わるツイー

トは数多く存在する.また,中嶋らは観光スポットでの過去の

体験についてつぶやかれたツイートを収集対象としていないた

(注1):Twitter,http://twitter.com/

(注2):Foursquare,https://ja.foursquare.com/

(注3):Instagram,http://instagram.com/

め,観光情報の取りこぼしが多い. さらに,中嶋らの手法では

Twitter ユーザのタイムラインからのみ観光スポットを収集す

るため,得られる観光スポットが少ないという問題がある.そ

こで本研究では,あらかじめ観光スポットを収集し,その一覧

を生成する.また,本研究では位置情報の有無に関わらず全て

のツイートを対象に観光ツイートを収集し,分類する.そして,

それらのツイートに含まれる観光情報を用いて観光ルートを推

薦する手法を提案する.なお,本稿において,観光スポットと

は観光名所や店のことを指し,実際の観光体験に基づいてつぶ

やかれたツイートのことを観光ツイートと呼ぶ.

本稿の構成は次の通りである.まず 2. 節で関連研究につい

て述べ,3.節で提案する観光ルート推薦システムの概要を述べ

る.次に 4.節で観光スポット一覧の提示方法について説明し,

5.節で推薦ルートの決定方法について述べる.そして,6.節で

提案手法に対する評価実験を行い,最後に 7.節で本研究のまと

めと今後の課題について述べる.

2. 関 連 研 究

中嶋ら [1]は位置情報付きツイートを用いて,観光ルートを

推薦する手法を提案した.彼らは旅行者のツイートに頻繁に現

れる特徴と Foursquare や Instagram のサービスを用いて観光

スポットでつぶやかれたツイートを収集し,そのユーザのタイ

ムラインから観光ルートを抽出した.また,収集したツイート

を,手がかり語や品詞の特徴から「食事」,「景観」,「行動」の

3 つのカテゴリに分類し, その結果を用いて観光ルートを推薦

した.中嶋らの手法では,Twitter ユーザのタイムラインから

のみ観光スポットを収集しているため,得られる観光スポット

が少ない.そこで本研究では,あらかじめ観光スポットを収集

する手法を提案する.また,中嶋らは位置情報が付与されたツ

イートと本文に「なう」を含むツイートのみを対象にして,観

光スポットでリアルタイムにつぶやかれたツイートを収集した

Page 2: Twitter を利用した観光ルート推薦の一手法 - IPSJ …DEIM Forum 2015 G7-6 Twitter を利用した観光ルート推薦の一手法 新井 晃平y 新妻 弘崇yy 太田

が,本研究では位置情報の有無に関わらず全てのツイートを対

象に観光ツイートを収集する.

Twitter を利用して観光情報を抽出する研究には藤坂ら [2]

の研究があり,彼らもまた位置情報付きツイートを用いて観光

情報の抽出を試みている.藤坂らは,K-means 法により分割

した日本の各領域に対して,ツイート数,Twitter ユーザ数,

Twitter ユーザの移動量からノーマルパターンを規定し,ある

時間におけるツイート数,Twitter ユーザ数,Twitter ユーザ

の移動量と,ノーマルパターンとを比較することで地域イベン

トが行われている領域を検知した.

石野ら [3] は ANPI NLP で提供される震災情報に関わるツ

イートを利用して被災時における避難経路を自動抽出する手法

を提案した.石野らは機械学習を用いて,移動元,移動先,移

動手段のタグを東日本大震災に関連するツイートに自動付与す

ることによって,被災者の行動経路を抽出した.また,先行研

究として,小田原ら [4]は旅行ブログエントリに対してタグ付

与を行い,旅行者の行動経路を自動抽出する手法を提案した.

長谷川ら [5]は行動計画の立案支援として,ブログからユー

ザの行動時の代表的な経路とその文脈を抽出し,地図上にマッ

ピングして提示するシステムを提案した.長谷川らの手法では,

ブログ内に出現する各地名に対して,旅行者が実際にその場所

を訪れたかどうかを文脈から判定し,訪れたと判定した場合は

その地名をルート要素とする.その後,ルート要素に対して順

序付けを行い,地名による系列パターンを抽出した.

3. 観光ルート推薦システムの概要

まず最初に,提案する観光ルート推薦システム(以下,提案

システムと呼ぶ)の概要について説明する.提案システムは,

次の手順でユーザに観光ルートを推薦する.

( 1) ユーザが出発地,到着地,出発時刻,到着時刻を入力

( 2) 入力された条件を満足する観光スポット一覧を提示

( 3) ユーザが訪ねたい観光スポットを 1 つ選択

( 4) ユーザの選択した観光スポットを含むルートを推薦

まず手順 ( 1)でユーザが出発地,到着地,出発時刻,到着

時刻を入力すると,手順( 2)に記したように,提案システム

は入力された条件を満足する観光スポットの一覧をユーザに提

示する.ここで,入力された条件を満足する観光スポットとは,

5. 2節で述べる観光ツイートの時間帯分布についての条件を満

たし,かつ,ユーザが指定した時間内で訪ねることができる観

光スポットを指す.観光スポット一覧をユーザに提示するため

には,あらかじめ観光スポットを収集する必要がある.そこで本

研究では,Google Places API(注4)と Yahoo!知恵袋 質問検索

API(注5)を用いて観光スポットの一覧を取得する.

指定した時間内で訪ねられる観光スポットであるかを判定す

るためには,観光スポットでの滞在時間や,移動時間を推定す

る必要がある.滞在時間は 4. 2. 2節の方法で抽出する観光ルー

(注4):Google Places API,https://developers.google.com/places/

(注5):Yahoo!知恵袋 質問検索 API,http://developer.yahoo.co.jp/

webapi/chiebukuro/chiebukuro/v1/questionsearch.html

トを利用して求め,移動時間は Google Directions API(注6)を

用いて取得する.

そして,手順( 3)でユーザは,提示された観光スポット一覧

から訪ねたい観光スポットを 1 つ選択する.すると,手順( 4)

に記したように,提案システムはユーザが選択した観光スポッ

トを含むルートを作成し,ユーザに推薦する.なお,観光スポッ

トでの滞在時間や移動時間は,手順( 2)で観光スポットを選

別するために用いた方法で推定する.本研究では,観光ルート

を決定するための指標として次の 3 つを使用した.これらの詳

細は 5.節で述べる.

• 観光ルート内における観光スポットの共起頻度

• ツイートの時間帯分布

• ツイートをカテゴリ分類した結果

4. 観光スポット一覧の提示

提案システムは,ユーザが出発地,到着地,出発時刻,到着

時刻を入力すると,5. 2節で述べる観光ツイートの時間帯分布

についての条件を満たし,かつ,ユーザが指定した時間内で訪

ねることができる観光スポットの一覧をユーザに提示する.

最初に 4. 1節で観光スポットを収集する手法について述べる.

また,各観光スポットについてつぶやかれた観光ツイートを収

集し,ユーザタイムラインから観光ルートを抽出する方法につ

いて 4. 2節で説明する.さらに,4. 3節で観光スポットでの滞

在時間や,移動時間を推定する方法について述べる.

4. 1 観光スポットの収集

ここでは,Google Places API と Yahoo!知恵袋 質問検索

API(以下,質問検索 API と呼ぶ)を用いて観光スポットを収

集する手法について述べる.

4. 1. 1 観光スポット候補の収集

本研究では,Google Places API のプレイス検索を用い,以

下の手順で,ある地点の周辺に位置する施設一覧を取得する.

まず,任意の地点を決め,Geocoding API(注7)を用いてその

地点の位置情報(緯度,経度)を取得する.その後,得られた

位置情報を用いて Google Places API で周辺の施設の情報(施

設名,緯度,経度,タイプ)を 20 件取得する.タイプとは,

aquarium(水族館)や hospital(病院)など,Google によっ

て定義されたカテゴリのことを指す.次に,取得した 20 件の

各施設に対しても同様に Google Places API を用いて周辺情報

を取得する.これを繰り返し,新しい施設名が出現しなくなっ

た場合,この処理を停止する.本研究では,図 1に示す 10 種

類のタイプを観光スポット候補の取得に利用した.

4. 1. 2 観光スポットの選定

4. 1. 1節で収集した観光スポット候補一覧において,各候補

が観光スポットであるかどうかを判定する必要がある.観光ス

ポットの判定には,質問検索 APIを用いる.質問検索 API で

は,Yahoo!知恵袋に公開されている質問の中から,あるキー

(注6):Google Directions API,https://developers.google.com/maps/

documentation/directions/

(注7):Geocoding API,http://www.geocoding.jp/api/

Page 3: Twitter を利用した観光ルート推薦の一手法 - IPSJ …DEIM Forum 2015 G7-6 Twitter を利用した観光ルート推薦の一手法 新井 晃平y 新妻 弘崇yy 太田

amusement park(遊園地) aquarium(水族館)

cafe(カフェ) establishment(施設)

museum(美術館/博物館) park(公園)

place of worship(礼拝所) restaurant(レストラン)

spa(温泉、スパ) zoo(動物園)

図 1 観光スポット候補の取得に利用するタイプ

表 1 閾値と観光スポットの収集精度

都道府県 閾値 再現率 適合率 F 値

岡山県 0.27 0.917 0.776 0.841

京都府 0.32 0.970 0.922 0.945

表 2 得られた観光スポットの例

岡山県の観光スポット 京都府の観光スポット

岡山城 清水寺

岡山後楽園 伏見稲荷大社

吉備津神社 知恩院

池田動物園 京都水族館

岡山県立博物館 京都国立博物館

津山城 金閣寺

ワードを含む質問本文や質問に対するベストアンサー,キー

ワードにマッチした質問の総数等を取得することができる.

本研究では,4. 1. 1節で得たそれぞれの観光スポット候補名

をキーワードとして質問検索 API を用い,それにマッチした

質問の総数を取得する.ある観光スポット候補 c に対して,全

カテゴリでマッチした質問の総数を Ac とし,「地域,旅行,お

出かけ」カテゴリ内の下位に位置する「国内」カテゴリでマッ

チした質問の総数を Lc とした時,各観光スポット候補が観光

にどの程度関連するかの度合い(関連度)Rc を次式で表す.

Rc = Lc/Ac (1)

次に,求めた関連度 Rc が設定した閾値を上回る観光スポッ

ト候補を観光スポットとして選定する.閾値は次のようにして

設定する.各観光スポット候補に対し,人手で観光スポットで

あるかどうかを判定したものを正解データとする.閾値を 0 か

ら 1まで 0.01 間隔で設定し,それぞれの閾値において取得した

観光スポット群の適合率と再現率を求める.さらに,求めた適

合率および再現率から F 値を算出する.算出した F 値の中で,

最大の F 値をとる時の閾値を選定に利用する閾値と定める.

この手法を用いて,岡山県と京都府の観光スポット候補一覧

を対象に閾値を設定した.岡山県の閾値は 0.27 となり,合計で

79 件の観光スポットが得られた.また,京都府の閾値は 0.32

となり,合計で 134 件の観光スポットが得られた.決定した閾

値とその時の再現率,適合率,F 値を表 1に示し,得られたス

ポットの例を表 2に示す.

4. 2 観光体験情報の収集

次に,各観光スポットについてつぶやかれた観光ツイートを

収集する方法について説明する.また,収集した観光ツイート

が観光スポットでリアルタイムにつぶやかれたツイートである

かを判定し,Twitter ユーザの観光ルートを抽出する手法につ

いて述べる.

4. 2. 1 観光ツイートの収集

観光ツイートを収集するためには,どのツイートが実際の観

光体験に基づくツイートであるかを判定する必要がある.そこ

で,本研究では以下の 5 項目のうち 1 つ以上の特徴を満たす

ツイートを観光ツイートであるとみなす.

( 1) URL中に“swarmapp.com”または“4sq.com”を含む

( 2) URL 中に“ tou.ch”を含む

( 3) URL 中に“ instagram.com”を含む

( 4) URL 中に“ .jpg”または“ .png”を含む

( 5) 観光スポットを訪れたとみなせる表現が存在する

項目( 1)は Foursquare を用いたツイートに現れる特徴で

ある.Foursquare とは,訪れた場所にチェックインすることで

得点が得られ,その得点に応じてバッジを獲得することができ

る位置情報を利用したゲームの一種である.

項目( 2)はロケタッチ(注8)を利用したツイートに出現する

特徴であり,Foursquareと同様に,ユーザが訪れた場所を友人

や知人と共有するサービスである.

項目( 3)は Instagram を用いたツイートに現れる特徴であ

る.Instagram は画像共有サービスの一種であり,その観光ス

ポットを訪れて撮影された画像であると判定し収集する.

項目( 4)は Instagram と同様,その観光スポットを訪れて

撮影された画像であると判定して収集する.ただし本研究で

は,ノイズを減らすため,同じユーザが同じ内容で投稿したツ

イートは bot であると判定し,収集しない.なお,bot とは

Twitter の機能を用いて作られた自動発言システムである.

最後に,項目( 5)の観光スポットを訪れたとみなせる表現

が出現する場合について述べる.Twitter 利用者の間で頻繁に

利用される語「なう」は,場所や動作の後につけ,今どこにい

るかや何をしているかを表す語であり,例えば「岡山駅なう」

ならば「今岡山駅にいる」という意味で使用される.よって,

「なう」が観光スポットの直後に用いられる場合は観光スポッ

トでつぶやかれたツイートであると判定する.また,「わず」も

「岡山駅わず」のように使用され,観光スポットの直後に使用

される場合は過去に観光スポットを訪れたとみなすことができ

る.同様に,「@」,「at」,「in」が観光スポットの直前に出現し

た場合も観光スポットでつぶやかれたツイートであると判定す

る.また,ツイート本文に対して形態素解析を行い,表 3に示

すような表現が観光スポット名より後方に出現した場合も観光

ツイートであるとみなす.なお,形態素解析器には Sen(注9)を

使用した.

本研究では,観光スポット名を本文に含む全てのツイートか

ら観光ツイートの収集を試みる.観光ツイートの収集は次の手

順で行う.まず,観光スポットを本文中に含む,リツイートと

リプライを除く全てのツイートを取得する.その後,取得した

ツイートそれぞれに対して,先述した( 1)から( 5)の特徴

が含まれているかどうかでフィルタリングを行い,1 つ以上の

特徴を含むツイートを観光ツイートとして収集する.

(注8):ロケタッチ,http://tou.ch/

(注9):形態素解析システム Sen,https://www.mlab.im.dendai.ac.jp/

˜yamada/ir/MorphologicalAnalyzer/Sen.html

Page 4: Twitter を利用した観光ルート推薦の一手法 - IPSJ …DEIM Forum 2015 G7-6 Twitter を利用した観光ルート推薦の一手法 新井 晃平y 新妻 弘崇yy 太田

表 3 観光スポットを訪れたとみなす表現

出現する表現 具体例

「行く/着く/来る」+「た/ました」 着いた

形容詞 +「た」 楽しかった

名詞-サ変接続 +「する」+「た/ました」 満足しました

名詞-形容動詞語幹 +「だ/です」+「た」 綺麗だった

「行く/来る」+「て」+「き/み」+「た/ました」 来てみました

4. 2. 2 観光ルートの抽出

あるユーザによって観光スポットでリアルタイムにつぶやか

れたツイート集合を時系列順に並べることで,そのユーザの

観光ルートを抽出することができる.そこで,収集した観光ツ

イートに対して,それがリアルタイムにつぶやかれたものであ

るか,もしくは,過去の観光スポットでの体験についてつぶや

かれたものであるかを判別する.本研究では,4. 2. 1節で列挙

した 5 項目のうち,項目( 1),項目( 2),項目( 5)中の

「なう」,「@」,「at」,「in」のいずれかの特徴を満たすツイート

をリアルタイムにつぶやかれたツイートであると判定する.

ある観光ツイートが,観光スポットでリアルタイムにつぶや

かれたツイートであると判定できる場合,そのユーザのタイム

ラインからリツイートとリプライを除く同じ日に投稿された全

てのツイートを取得し,同様にしてリアルタイムにつぶやかれ

たと判断できるツイートを収集する.例えば,あるユーザのタ

イムラインから抽出した,リアルタイムにつぶやかれたツイー

ト群を時系列順に並べると表 4のようになる.表 4のツイート

は全て Foursquare を用いてつぶやかれたツイートであり,こ

のユーザは仙台空港を出発した後,清水寺をはじめとする京都

府のいくつかの観光名所を訪れ,最終的には滋賀県に移動しホ

テルに宿泊したことがわかる.

表 4からもわかるように,Foursquare を用いたツイートには

「I’m at」の直後,もしくは「(@」の直後にユーザが現在いる

場所が示される.また,ロケタッチを用いたツイートにも「に

タッチ」や「に写真付きタッチ」という文字列の直前に位置情

報が記述されるという特徴がある.こういった手がかり語をも

とに観光スポットを抽出し,それらを時系列順に並べることで

旅行者の観光ルートを抽出する.

また,観光スポットでつぶやかれたわけではないが,1 つの

ツイート内で複数の観光スポットを訪れた記述があるツイート

も存在し,複数の観光スポットを「→」で繋いだ形で記述され

ることが多い.このようなツイートは 4. 1節で挙げたどの項目

にも当てはまらないが,観光スポットの出現順序がそのまま観

光ルートになっているとみなして抽出する.

4. 3 移動時間と滞在時間

本研究では,2 地点間の移動時間を Google Directions API

を用いて取得する.Google Directions API は,指定した出発

地点から目的地点までのルート検索ができるサービスであり,

指定した 2 地点間の移動距離と移動時間を得ることができる.

例えば,出発地に清水寺,到着地に金閣寺を指定すると,移動

時間 27 分,移動距離 9.8 km というレスポンスが返される.

ある観光スポットにおける滞在時間の推定には,4. 2. 2節で

抽出した観光ルートを利用した.ある観光スポット A で観光

ツイートがつぶやかれた時刻と,次に別の観光スポット B で観

光ツイートがつぶやかれた時刻の差を求め,その結果から 2 点

間の移動時間を引いたものを,観光スポット A の滞在時間と

して求めた.例えば,清水寺で 12 時 30 分にツイートをした

ユーザが,次に 13 時 50 分に金閣寺でツイートしたとすると,

清水寺における滞在時間は 80 分から 27 分 を引いた 53 分と

なる.この計算を抽出した観光ルート全てに対して行い,得ら

れた滞在時間を平均したものを滞在時間として設定する.

5. 観光ルートの推薦

ユーザが提示された観光スポット一覧から訪れたい観光ス

ポットを 1 つ選択すると,提案システムはユーザが選択した観

光スポットを含むルートを作成し,ユーザに推薦する.

本節では,観光ルートの決定に使用する 3 つの指標について,

それぞれ 5. 1節,5. 2節,5. 3節で説明する.また,それらの

指標を用いた,観光ルート推薦手法について 5. 4節で述べる.

5. 1 観光スポットの共起頻度

4. 2. 2節で述べたように,本研究では,ある観光スポットで

リアルタイムに観光ツイートをつぶやいたユーザのタイムライ

ンから,そのユーザが実際に巡った観光ルートを抽出する.

ある観光スポット A をルート内に含む全ての観光ルートか

ら,A 以外の観光スポットの出現回数を求めることによって,

どのような観光スポットが A と共に訪れられることが多いか

がわかる.本研究では,観光スポット A を訪れたユーザが,同

じ観光ルート内で観光スポット B を訪れる頻度を,A に対す

る B の共起スコアと定義する.そしてこの共起スコアを,観

光ルート推薦のための指標の 1 つとして用いる.

例えば,観光スポット A を訪れたユーザが 40 人いたとして,

そのうち 10 人が同じ観光ルート内で観光スポット B を訪れた

とする.この時,観光スポット A に対する観光スポット B の

共起スコアは,10/40 = 0.25となる.

5. 2 観光ツイートの時間帯分布

観光ルートを推薦するための指標の 1 つとして,観光ツイー

トの時間帯分布を用いる.観光客が多い時間帯を検出するため

に,24 時間を 3 時間毎に区切り,その時間帯毎に観光スポッ

トでリアルタイムにつぶやかれた観光ツイート数の割合を求め

る.本研究では,この時間帯毎の観光ツイート数の割合を時間

帯スコアと定義する.

例えば,50 件のツイートが観光スポット A でリアルタイム

につぶやかれており,50 件のうち 12 時から 15 時までの間に

リアルタイムにつぶやかれた観光ツイート数が 20 件のとき,

時間帯スコアは,20/50 = 0.4となる.

5. 3 観光ツイートのカテゴリ分類

観光スポットを訪れたユーザがそこでどのような体験をした

かを知ることは,これから旅行をする者にとって大変有益な情

報である.そこで本研究では,各観光スポットについて収集し

た観光ツイートを「食事」,「景観」,「土産」,「行動」の 4 つのカ

テゴリに分類する.具体的には,観光ツイートの本文中に次の

ような手がかり語が出現するかどうかに基づいて,観光ツイー

Page 5: Twitter を利用した観光ルート推薦の一手法 - IPSJ …DEIM Forum 2015 G7-6 Twitter を利用した観光ルート推薦の一手法 新井 晃平y 新妻 弘崇yy 太田

表 4 ある旅行者の Foursquare を利用したツイート

ツイート時刻 ツイート本文

6:20 開門待ち。 (@ 仙台空港 (Sendai Airport - SDJ/RJSS) in 名取市, 宮城県) https://www.swarmapp.com/...

9:33 I’m at 大阪国際空港 (ITM/RJOO) in 豊中市, 大阪府 https://www.swarmapp.com/...

12:20 世界遺産。 (@ 清水寺 (Kiyomizu-dera Temple) in 京都市, 京都府) https://www.swarmapp.com/...

12:44 I’m at 六花亭 in 京都市東山区, 京都府 https://www.swarmapp.com/...

15:01 I’m at 金閣寺 不動堂 https://www.swarmapp.com/...

15:56 ハイペースすぎ。 (@ 北野天満宮 (Kitano-Tenmangu Shrine) in 京都市, 京都府) https://www.swarmapp.com/...

17:53 めちゃくちゃいいホテルやー。 (@ 大津プリンスホテル in 大津市, 滋賀県) https://www.swarmapp.com/...

表 5 行動に関するツイートとみなす表現

出現する表現 具体例

動詞 +「た/ました」 遊んだ

名詞-サ変接続 +「する」+「た/ました」 散策した

名詞-サ変接続 +「できる」+「た/ました」 体験できた

名詞-サ変接続 +「なう」 参拝なう

トを分類する.なお,手がかり語の収集にはWikipedia(注11)と

Weblio 類語辞典(注12)を用いた.また,括弧内の数字は収集し

た手がかり語の個数を表している.

• 食事に関するツイート

– 「うどん」などの料理の名称(2,033)

– 「懐石料理」などの料理の種類(70)

– 「昼食」などの食事の形態(18)

– 「カフェ」などの食事施設の名称(32)

– 「おいしい」などの食事に対する評価(14)

– 「食べる」などの食事に関する動作(11)

• 景観に関するツイート

– 「夜景」などの景観の対象(26)

– 「雨」などの天候に関する語(27)

– 「綺麗」などの景観に対する評価(30)

– 「撮る」などの景観に関する動作(7)

• 土産に関するツイート

– 「きびだんご」などの土産の名称(316)

– 「名物」などの土産に関する語(8)

– 「買う」などの入手を表す動作(5)

• 行動に関するツイート

– 表 5に示す表現

ここで,表 5に示した「動詞」には,「来る」,「行く」,「向か

う」,「着く」を含めないものとする.これは,「来る」や「行く」

といった動詞が移動を表す動詞であり,観光スポットでの体験

を表さないことが多いためである.

Wikipedia の各記事はカテゴリ分類されており,例えば「料

理」カテゴリの下位に「揚げ物」や「卵料理」といったサブカ

テゴリが存在し,さらにその「揚げ物」カテゴリの下位に「か

ら揚げ」や「コロッケ」などの記事が存在する.本研究では

MediaWiki API(注13)を用いて,Wikipedia の比較的上位に位

(注11):Wikipedia,http:// ja.wikipedia.org/wiki/

(注12):Weblio 類語辞典,http://thesaurus.weblio.jp/

(注13):MediaWiki API,http://www.mediawiki.org/wiki/API:Main

page/

置する「料理」や「土産菓子」のようなカテゴリを指定してそ

の下位に存在するサブカテゴリや記事タイトルを取得し,それ

を手がかり語とした.

本研究では,観光ツイートをカテゴリ分類した結果を,観光

ルート推薦のための指標として用いる.なお,「食事」,「景観」,

「土産」,「行動」のいずれかのカテゴリに分類された観光ツイー

ト総数のうち,あるカテゴリに分類されたツイートの割合を,

本研究では分類スコアと呼ぶ.

例えば,ある観光スポット A についてつぶやかれた観光ツ

イートが計 100 件あり,そのうち 80 件が「食事」,「景観」,

「土産」,「行動」のいずれかに分類されたとする.さらに,そ

の 80 件のうち「景観」に分類されたツイート数が 60 件であ

るとき,その割合,すなわち「景観」に対する分類スコアは,

60/80 = 0.75となる.

5. 4 ルート推薦アルゴリズム

5. 4. 1 提示する観光スポットの決定

提案システムにおけるユーザの最初の入力は,出発地 PS,

到着地 PG,出発時刻 TS,到着時刻 TG である.また,ルート

R =< PS,PG >とする.出発地 PS からある観光スポット Si

までの移動時間をMS,i ,観光スポット Si から到着地 PG まで

の移動時間をMi,G ,2 つの観光スポット Si と Sj 間の移動時

間をMi,j とし,観光スポット Si での滞在時間を Vi で表す.

また,ある時刻を t とし,時刻 X =(TS +MS,i + Vi/2)か

ら時刻 Y =(TG −Mi,G − Vi/2)までの区間において,観光ス

ポット Siの最も高い時間帯スコア ZmaxX<=t<=Y (Si)を求める.8 つ

に分割した時間帯スコアを Z(Si)0, Z(Si)3,…, Z(Si)21 と定義

し,ZmaxX<=t<=Y (Si) を次式で表す.

ZmaxX<=t<=Y (Si) = max

⌊X/3⌋<=j<=⌊Y/3⌋Z3j(Si) (2)

本研究では,次式の両方を満たす観光スポットの一覧をユー

ザに提示する.

ZmaxX<=t<=Y (Si) >= 0.125 (3)

TG − TS >= MS,i + Vi +Mi,G (4)

5. 4. 2 推薦ルートの決定

提示した観光スポット一覧の中からユーザが訪れたい観光ス

ポット SU を 1 つ選択すると,提案システムは SU を含む観光

ルートをユーザに推薦する.従って,ルート R に SU を加え,

R =< PS,SU,PG >とする.これより先の観光ルート推薦ア

ルゴリズムについて,図 2を用いて説明する.

Page 6: Twitter を利用した観光ルート推薦の一手法 - IPSJ …DEIM Forum 2015 G7-6 Twitter を利用した観光ルート推薦の一手法 新井 晃平y 新妻 弘崇yy 太田

図 2 観光スポット推薦アルゴリズム

• Phase 1

ここでは,時刻 X = (TS + MS,U + VU/2)から

Y =(TG −MU,G − VU/2)までの区間と重なりがあり,最も

高い時間帯スコア ZmaxX<=t<=Y (SU ) が得られる時間帯を求める.

図 2は,15 時から 18 時までの時間帯スコアが最大である例を

説明している.

• Phase 2

本研究では,観光スポットの時間帯スコアが最も高くなる区

間に,4. 3節で求めた滞在時間の半分はユーザが滞在すること

を条件とする. 図 2 に示した通り,SU における滞在時間 VU

は 120 分であるので,120 分のうちの 60 分は少なくとも 15

時から 18 時までの間に SU に滞在できるようにする.従って,

ユーザは 14 時から 19時までの区間で 120 分 SU に滞在する

ことになる.しかし,ユーザが設定した到着時刻 TG は 19 時

であり,SU から PG までにかかる移動時間MU,G は 30 分 で

あるため,遅くとも 18 時 30 分に SU を出発しなければ TG を

超えてしまう.そのため,観光スポット SU の推薦が可能な時

間は,図 2の Phase 2 に矢印で示す 14 時から 18 時 30 分ま

での区間である.

• Phase 3

Phase 3 では,Phase 2 で定めた時間内でユーザが SU に最

も早く訪れる場合と最も遅く訪れる場合を考える.ここで,あ

る観光スポット Siを最も早く出発する時刻をminTDi ,Siに最

も遅く到着する時刻をmaxTAi とする.Phase 2 より,minTD

U

は 16時,maxTAU は 16 時 30 分である.

4. 3 節で求めた滞在時間の半分は時間帯スコアが最も高く

なる区間に滞在するという条件を満たし,推薦ルートに追加

する観光スポットを決定するには,TS から maxTAU の間と,

minTDU から TG の間で推薦すべき観光スポットを探せばよい.

それぞれの区間で,式 (3),(4)を満たし,共起スコア,時間

帯スコア,カテゴリスコアの和が最大となる観光スポットを導

出し,それらを追加候補 SA,SB とする.ただし,式 (3),(4)

においては,時刻 X,Y ならびに PS,PGをそれぞれの区間の

ものに置き換えて計算する.そして,SAと SB を比較してスコ

アが大きい追加候補を推薦ルートに加える.図 2は,SB のスコ

アが SA より大きかった場合を説明している.SB は,minTDU

から TG の区間で導出した観光スポットなので,SU の後に追加

する.すなわち,R =< PS,SU,SB,PG >とする.なお,SB

をルートに追加したことによって生じる時間の制約については

Phase 5 で述べる.

• Phase 4

Phase 4では,新たに追加された観光スポット SB を検出した

区間で,Phase 1 同様,SB の時間帯スコアが最も高くなる時間

帯を求める.すなわち,時刻 X =(minTDU +MU,B + VB/2)

から Y =(TG −MB,G − VB/2)の区間と重なりがあり,最も

高い時間帯スコア ZmaxX<=t<=Y (SB) が得られる時間帯を求める.

図 2は,15 時から 18 時までの時間帯スコアが最大である場合

を説明している.

• Phase 5

Phase 5 では,4. 3節で求めた滞在時間の半分はユーザが滞

在するという条件をルート内の観光スポット全てに適用し,そ

れぞれの推薦可能な時間帯を求める.図 2に示すように,SB の

滞在時間 VB は 60 分なので,SB の推薦が可能な時間は 14 時

30 分から 18 時 30 分となる.しかし,ユーザは少なくとも時

刻minTDU までは SU に滞在しなければならない.また,MU,B

が 30 分であるため,SB を推薦可能な時間帯は 16 時 30 分か

ら 18 時 30 分までの間である.一方,SU を推薦可能な時間帯

は,Phase 2 の段階で 14 時から 18 時 30 分の間となってい

たが,maxTAB は 17 時 30 分であり,MU,B が 30 分であるの

で,SU を推薦可能な時間帯は 14 時から 17 時である.以上の

ことから,観光スポット SU と SB を推薦可能な時間帯は,そ

れぞれ図 2の Phase 5 に矢印で示す範囲である.

• Phase 6

Phase 6 で推薦ルートに追加する観光スポットを決定する.

ルート内の観光スポット全てについて,Phase 5で定めた時間内

で,ユーザが最も早く訪れる場合と最も遅く訪れる場合を考え

る.Phase 5より,minTDU は 16時,maxTA

U は 15時,minTDB

とmaxTAB はともに 17 時 30 分である.次に推薦ルートに追加

する観光スポットを決定するには,R =< PS,SU,SB,PG >

Page 7: Twitter を利用した観光ルート推薦の一手法 - IPSJ …DEIM Forum 2015 G7-6 Twitter を利用した観光ルート推薦の一手法 新井 晃平y 新妻 弘崇yy 太田

において,PS と SU,SU と SB,SB と PG の間でそれぞれ推

薦すべき観光スポットを探す.すなわち,TS から maxTAU ま

で,minTDU から maxTA

B まで,さらに,minTDB から TG ま

での間で,それぞれ追加候補を探す.

それぞれの区間について,追加候補 SC,SD,SE を導出し,

SC,SD,SEを比較してスコアが最も大きい追加候補を推薦ルー

トに加える.図 2では,SCのスコアがSD,SEより大きかった場

合を示している.SCは,TSからmaxTAU の間で得られた観光ス

ポットなので,PSの次に追加し,R =< PS,SC,SU,SB,PG >

となる.

提案手法では,追加候補,すなわち,推薦ルートに追加でき

る観光スポットがなくなるまで Phase 4 ,Phase 5,Phase 6

を再帰的に繰り返すことで,推薦ルートを決定する.

6. 評 価 実 験

本節では,収集した観光ツイートの適切さと,観光ツイート

の分類精度を評価実験により求める.また,作成した観光ルー

トを評価する.

6. 1 観光ツイートの収集実験

「岡山後楽園」,「倉敷美観地区」,「清水寺」,「伏見稲荷大社」

の 4 つの観光スポットを対象として観光ツイートを収集し,そ

の適合率,再現率,F 値を求めた.「岡山後楽園」と「倉敷美観

地区」については 2014 年 12 月 21 日から 2015 年 1 月 9 日

までの間に投稿されたツイートから観光ツイートを収集した.

また,「清水寺」と「伏見稲荷大社」は 2014 年 12 月 21 日から

2014 年 12 月 23 日までの間に投稿されたツイートを収集した.

対象の期間に投稿されたツイートから人手により観光ツイー

トを収集し,正解データとして用いた.人手で収集した観光ツ

イートは「岡山後楽園」が 178 件,「倉敷美観地区」が 518 件,

「清水寺」が 483 件,「伏見稲荷大社」が 201 件あった.実験結

果を表 6に示す.

収集できなかった例としては,「伏見稲荷大社の千本鳥居凄

い!」のように,4. 2. 1節で挙げた特徴が現れないものがあっ

た.また,誤って収集した例としては,「播州清水寺はもう正

月の準備万端。 http://instagram.com/...」のような,京都の

清水寺ではない同名の観光スポットについての観光ツイートを

誤って検出した例もあった.また,「伏見稲荷大社に行ったらし

い」のような,自分の体験ではないツイートも誤って検出して

いた.

中嶋らの手法では位置情報の付与されたツイートと本文中に

「なう」が含まれるツイートのみを対象としているため,今回得

られた観光ツイートのおよそ 1 割程度しか収集できなかった.

また,中嶋らの観光ツイート収集結果は再現率 0.719,適合率

0.837 であった.表 6と比較すると,適合率でも本手法の方が

高い結果を示している.このことから,本研究における観光ツ

イートの収集手法は中嶋らの手法より有用であると言える.

6. 2 観光ツイートの分類実験

6. 1節に示した 4 つの検索スポットと期間において収集した

観光ツイートを対象に,観光ツイートの「食事」,「景観」,「行

動」,「土産」カテゴリへの分類精度を調べた.各カテゴリに分

表 6 観光ツイートの収集結果

観光スポット 再現率 適合率 F 値

岡山後楽園 0.854 0.849 0.852

倉敷美観地区 0.903 0.876 0.890

清水寺 0.884 0.846 0.864

伏見稲荷大社 0.901 0.858 0.879

合計 0.890 0.859 0.874

表 7 観光ツイートの分類精度

観光スポット 食事 景観 行動 土産

岡山後楽園 0.652 0.831 0.629 0.571

倉敷美観地区 0.777 0.782 0.717 0.625

清水寺 0.671 0.776 0.622 0.833

伏見稲荷大社 0.556 0.883 0.775 0.750

合計 0.707 0.801 0.681 0.711

類されたツイートを,人手によりそのカテゴリにふさわしいか

どうか判定し,適切なものの割合を分類精度として求めた.実

験結果を表 7に示す.

検出できなかった例をみると,「キレイだった」や「きれかっ

た」といったフレーズを「綺麗だった」という意味で解析でき

なかったために,「景観」カテゴリに分類されなかった.同様に,

「吉備団子」が平仮名表記されていた場合も「土産」に分類で

きなかった.誤って検出した例としては,「パンフレット」とい

う単語が本文中に出現した場合に,「パン」という食べ物の名前

を誤って検出して「食事」カテゴリに分類したものがあった.

6. 3 推薦ルートの評価

5. 4節で述べた方法で決定した観光ルートについて考察する.

提案システムで決定したルート(以下,提案ルートと呼ぶ)を,

Google Maps API(注14)で提供されるルートサービスを用いて

可視化した.比較対象としては,Google によって最適化され

た観光ルート(以下,最短ルートと呼ぶ)を用いた.提案ルー

トの例を図 3,最短ルートの例を図 4にそれぞれ示す.

図 3,図 4は,地点 A の御陵駅を 11 時に出発し,地点 H に

あるホテルに 19 時に到着するように指定した場合の観光ルー

トである.なお,必ず訪れねるスポットには,清水寺(図 3の

地点 D ,図 4の地点 F)を選択した.ユーザは地点 B の観光

スポットからアルファベット順に各観光スポットを巡る.

最短ルートを示す図 4に比べ,提案ルートを示す図 3では,

地点 B を訪れてから地点 C まで戻り,再び地点 B の近くにあ

る地点 D まで行き,地点 C 付近の地点 E に向かうといったよ

うに,移動経路に何度も往復が生じた.また,提案ルートと最

短ルートの合計移動時間を比較したところ,提案ルートが 81

分,比較ルートが 56 分と大きな差があった.このことから,提

案ルートは移動に関する効率は悪いことがわかる.これは,本

手法が観光スポット間の移動時間を重視せず,ツイートの時間

帯分布等により推薦ルートを決定したために生じた問題である.

一方で,図 4 における地点 E の法観寺や地点 F の清水寺,

地点 G の建仁寺は拝観・開館時間が決まっており,最短ルート

(注14):Google Maps API,http://developers.google.com/maps/

Page 8: Twitter を利用した観光ルート推薦の一手法 - IPSJ …DEIM Forum 2015 G7-6 Twitter を利用した観光ルート推薦の一手法 新井 晃平y 新妻 弘崇yy 太田

図 3 提案システムによる推薦ルート

図 4 最適化された観光ルート

では,法観寺と建仁寺をその拝観時間内で訪れられないが,提

案ルートでは拝観・開館時間内に訪れることができる.これは,

本手法がツイートの時間帯分布を利用して推薦ルートを決定し

たために生じた利点であり,最短ルートは観光スポット間の移

動時間しか考慮していないため,推薦すべきでない時間帯に観

光スポットを薦めてしまう.

提案ルートは 5. 4節で説明したアルゴリズムに基づいて決定

されるため,時間の制約を満たし,指標となる 3 つのスコアが

最も高くなる観光スポットであれば,距離が離れていても推薦

する.そのため,移動効率の悪いルートを推薦してしまうとい

う欠点があるが,一方で,移動効率のみを考慮した最短ルート

では推薦すべきでない時間帯に観光スポットを薦めてしまい,

観光スポットにおけるユーザの満足度が低くなるという欠点

がある.観光ルートを推薦するにあたって,移動効率に関わる

ユーザの満足度と,観光スポットにおけるユーザの満足度をど

ちらも満たすようなルートを導出することが望ましく,これは

今後の課題として挙げられる.また,図 3における地点 F の

哲学の道や地点 G の蹴上インクラインは春には桜の名所とな

る観光スポットである.そういった季節等の状況に応じて推薦

ルートを決定することも今後の課題である.

7. お わ り に

本研究では,Twitter を用いて,観光スポットでの実際の観

光体験に基づくツイートを収集し,それらのツイートに含まれ

る観光情報を利用して観光ルートを推薦する手法を提案した.

観光スポットの収集には Google Places API と Yahoo!知恵袋

質問検索 API を用いた.また,観光体験に関わるツイートか

どうかの判定には,旅行者のツイートに頻繁に現れる特徴や手

がかり語の有無を利用した.さらに,観光ツイートを「食事」,

「景観」,「行動」,「土産」に分類した結果と,リアルタイムにつ

ぶやかれた観光ツイートの時間帯分布,観光ルート内における

観光スポットの共起頻度を用いて,観光スポットをスコア付け

した.そしてそのスコアを用いて,推薦ルートを決定した.

観光ツイートの収集実験では適合率 0.859, 再現率 0.890, F

値 0.874 という結果を得た.また,観光ツイートの分類実験で

は「食事」が 0.707,「景観」が 0.801,「行動」が 0.681,「土産」

が 0.711 という分類精度が得られた.さらに,推薦ルートを分

析し,その有効性について考察した.

本研究で提案した観光ルート推薦手法では,推薦ルートを決

定する際に観光スポット間の移動効率を考慮していないため,

スコアが高い観光スポットが離れた位置に存在する場合に移動

効率の悪いルートになってしまうという問題がある.しかし,

本手法では観光ツイートの時間帯分布を指標に用いているため,

営業時間のある観光スポットをその時間内に訪れられるような

ルートを推薦できた.

今後の課題としては,移動効率の改善とともに,リアルタイ

ムなイベントの検出や,状況(季節やユーザの年齢,移動手段

など)を考慮した推薦方法の検討,インタフェースの実装と被

験者実験などが挙げられる.

文 献

[1] 中嶋勇人,新妻弘祟,太田学,“位置情報付きツイートを利用

した観光ルート推薦”,情報処理学会研究報告.データベース・

システム研究会報告,Vol.2013-DBS-158,No.28,pp.1-6,

2013.

[2] 藤坂達也,李龍,角谷和俊,“地域イベント発見のためのジオタ

グ付マイクロブログを用いたノーマルパターン検出手法”,平成

22 年度情報処理学会関西支部大会,Vol.2010,2010.

[3] 石野亜耶,小田原周平,難波英嗣,竹澤寿幸,“Twitter からの

被災時の行動経路の自動抽出および可視化”,言語処理学会 第

18 回年次大会,pp.907-910,2012.

[4] 小田原周平,石野亜耶,難波英嗣,竹澤寿幸,“ブログからの

ユーザの行動経路の自動抽出と可視化”,電子情報通信学会 第

20回Webインテリジェンスとインタラクション研究会,2011.

[5] 郡宏志,服部峻,手塚太郎,田島敬史,田中克己,“ブログからの

ビジターの代表的な行動経路とそのコンテキストの抽出”,電子

情報通信学会技術研究報告,Vol.106,No.149,pp.29-34,

2006.