TOP  >  学位論文  >  プローブカーデータとスポット間類似度を用いた旅行行動のモデル化

プローブカーデータとスポット間類似度を用いた旅行行動のモデル化

近年,予めコースが決まっている団体旅行に代わり,個人が自由に訪問するスポットを選択する個人旅行の旅行者が増加している. 従来,個人旅行の調査分析には,旅行者が記憶に基づき旅行行動を記入するアンケート方式が用いられてきた. この調査方式を用いた場合,旅行者への負担が大きいことや行動の記入漏れが生じるなどの問題がある. 一方,実際に道路を走行した自動車の位置や速度をGPSで測定したデータが,プローブカーデータとして大量に蓄積されている. プローブカーデータの記録はカーナビが自動的に行うので,アンケート方式に比べて客観性の高いデータを低コストで収集できるという利点がある.
そこで本研究では,観光旅行に車を利用するユーザのプローブカーデータを用いて,旅行行動をモデル化することを目的とする. 旅行行動のモデル化ができれば,個人旅行者がどこに訪れているのかなどを定量的に計測することが可能になる. また,得られたモデルを用いてユーザが次に遷移するスポットを予測することで,ユーザにスポットを推薦するシステムに活用することもできる. モデルとしては,ユーザがどのようなスポットをどのような順番で遷移したかに注目し,ユーザが次に遷移するスポットを予測することができるようなモデルを考える.
旅行行動のモデル化に関する従来研究では,ユーザの旅行行動を単純マルコフモデル(以下マルコフモデル)によってモデル化している. マルコフモデルは,次に遷移するスポットは現在のスポットのみに依存すると仮定するモデルである. しかし,マルコフモデルには,ユーザにほとんど訪れられていないマイナーなスポットからの遷移を適切に予測できないというスパース問題がある. 本研究では,類似したスポットにいるユーザは同じスポットに遷移しやすいという仮定のもと, スポット間類似度を用いてマルコフモデルにおけるスパース問題に対処する.
プローブカーデータから,ユーザがいつどこで停車したかという情報と,ユーザがカーナビに目的地として設定したPOI(Place Of Interest)の情報を得ることができる. 本研究では,停車情報をスポットに対応付け,POI情報を用いてスポット間類似度を計算した上で,スポット間の遷移のしやすさとして旅行行動をモデル化する. 以下に提案手法について述べる.
まず,ユーザの旅行行動をスポット間の遷移としてモデル化するため,多くのユーザが停車している場所をスポットとして抽出する. 本研究では,ユーザが停車した位置をMean-Shift法を用いてクラスタリングし,その結果得られたクラスタをスポットとする. スポット抽出の際に行ったクラスタリングに基づき,停車情報をスポットに対応付けることで,ユーザがどのような順でスポットを訪れたかの情報を得ることができる.
次に,Webから得られる外部データに基づいて,スポット間類似度を計算する. Webから得られる外部データを用いることにより,(1)スポットの特徴を細かく捉えることや, (2)世間がそのPOIに対して一般的に抱くイメージを反映した特徴を得ることや, (3)カーナビから得られるPOIと,現実世界の観光地等を対応付けることができる,
最後に,ユーザが次に遷移するスポットを予測するために,現在のスポットから他のスポットへのスコアを計算する. ユーザはこのスコアが大きいスポットに遷移すると予測する. マルコフモデルでは,データ中における現在のスポットからの遷移情報のみを利用していたのに対して,提案手法では, 現在のスポットと類似したスポットからの遷移情報も活用する. これにより,遷移情報が少なく従来のマルコフモデルでは有効な予測ができないようなマイナーなスポットでも,提案手法では有効な予測が可能となる.
以上のようにユーザの旅行行動をモデル化し,ユーザが次に遷移するスポットを予測したときの精度を,パイオニア製のカーナビによって蓄積されたプローブカーデータを用いて評価した. プローブカーデータとしては,2011年1月から12月の12ヶ月間において京都市で停車した車の情報を用いた. また,旅行者のみを抽出するため,京都府以外に住居を持ち2011年の12ヶ月間で京都市で停車を行った日が7日以内であるという条件のもとフィルタリングを行った. スポット抽出のパラメータを変えた4つのデータセットに対して提案手法を適用した結果,全てのデータセットにおいて,従来のマルコフモデルに比べて精度が高いという結果を得た. この結果より,提案手法による旅行行動モデルが,従来手法に比べて適切に旅行行動を表現していると言える.