237
経済産業省大臣官房調査統計グループ調査分析支援室委託調査 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 (ビッグデータを活用した新指標開発事業) 報告書 平成29年3月 PwC あらた有限責任監査法人

平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

経済産業省大臣官房調査統計グループ調査分析支援室委託調査

平成28年度

IoT推進のための新産業モデル創出基盤整備事業

(ビッグデータを活用した新指標開発事業)

報告書

平成29年3月

PwCあらた有限責任監査法人

Page 2: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

目次

本報告書の概要 ................................................................................................................................ 1

1.本事業の目的および全体方針 ................................................................................................ 1

2.ビッグデータを活用した新指標開発実証事業 ...................................................................... 2

3.ビッグデータの利活用に関する有識者委員会 ...................................................................... 3

4.新指標への活用に向けた包括的調査 ..................................................................................... 5

第1章 本事業の目的および全体方針 ............................................................................................ 7

1.本事業の目的 ......................................................................................................................... 7

2.全体方針 ................................................................................................................................ 8

(1)ビッグデータを活用した新指標開発実証事業の実施 .................................................... 8

(2)有識者委員会の運営、及び新指標への活用に向けた包括的調査事業の実施 ............. 10

(3)成果のとりまとめ・普及活動 .......................................................................................11

第2章 ビッグデータを活用した新指標開発実証事業 ................................................................ 12

1.実証事業の選定 ................................................................................................................... 12

2.実証事業評価委員会の開催 ................................................................................................. 14

3.実証事業結果概要 ................................................................................................................ 15

(1)データの収集・加工・維持・提供に係るもの ............................................................. 15

(2)新指標の開発等に係るもの .......................................................................................... 17

第3章 ビッグデータの利活用に関する有識者委員会 ................................................................ 58

1.有識者委員会 ....................................................................................................................... 58

2.ワーキンググループ(WG) .............................................................................................. 63

(1)規制・ルール整備検討WG .......................................................................................... 63

(2)マスター・システム整備検討WG ............................................................................... 66

3.経済産業統計の一層の向上に向けたビッグデータ活用の提言(案)取りまとめ ............. 70

第4章 新指標へのビッグデータ活用に向けた包括的調査 ......................................................... 71

1.国内調査 .............................................................................................................................. 71

2.海外調査 .............................................................................................................................. 78

別添資料 ......................................................................................................................................... 81

1.経済産業統計の一層の向上に向けたビッグデータ活用の提言(案) ................................ 81

2.実証事業報告書 ................................................................................................................... 81

Page 3: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

1

本報告書の概要

1.本事業の目的および全体方針

民間企業が保有するPOSデータ、サイバースペース上に蓄積されているブログや Twitter を

始めとしたソーシャルネットワーキングサービス(SNS)等の書き込み、政府等行政機関が保

有する統計情報や行政記録情報等のビッグデータについて、解析技術やAI技術等を活用して分

析を行うことで、既存の政府統計の補完、拡充、詳細化を実現し、従来の統計よりも速報性に優

れた指標を開発して、政府においては迅速で正確な景気判断・政策決定を、民間においては迅速

で的確な経営判断・意思決定を可能とすることを目的とする。

本事業は、(1)ビッグデータを活用した新指標開発実証事業の実施、(2)有識者委員会の運

営、及び新指標への活用に向けた包括的調査事業の実施、(3)成果のとりまとめ・普及活動の3

つから構成され、(1)ビッグデータを活用した新指標開発実証事業の実施における、個別の実証

事業については、公募等を行い再委託する。

事業全体のイメージは以下のとおり。

図表 1:事業全体イメージ

Page 4: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

2

2.ビッグデータを活用した新指標開発実証事業

本事業においては、公募等により選定された事業者に以下6つのテーマの実証事業を再委託し

て実施した。

ⅰ)POS等のビッグデータの収集・加工・維持・提供

ⅱ)SNS等のビッグデータの収集・加工・維持・提供

ⅲ)POS等のビッグデータを活用した新指標開発

ⅳ)SNS等のビッグデータとその解析技術を用いた新指標開発・評価・検証

ⅴ)POS、SNS等のビッグデータ、及び政府統計等を組み合わせた新指標開発

ⅵ)新指標の算出・公開サービスの実装・提供

実証事業全体のイメージと各事業の再委託事業者等は以下のとおり。

また、本事業においては、実証事業評価担当委員4名による実証事業評価委員会(再委託先事

業提案内容技術審査を含む)を月に1回程度、計5回開催した。

実証事業の実施結果については、別添資料2として、実証事業報告書を添付しているほか、本

報告書の第2章 ビッグデータを活用した新指標開発実証事業 3.実証事業結果概要において、

概要を取りまとめている。

図表 2:実証事業全体イメージ

Page 5: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

3

3.ビッグデータの利活用に関する有識者委員会

本事業においては、以下9名の委員及び1名の審議協力者(五十音順、敬称略)によって、計

3回のビッグデータの利活用に関する有識者委員会を開催した。

【委員】

氏名 所属 役職 備考

小西 葉子 経済産業研究所 上席研究員 ・実証事業評価担当 ・WG1座長

小巻 泰之 日本大学 教授

斎藤 太郎 ニッセイ基礎研究所 経済調査室長

佐藤 忠彦 筑波大学 教授 ・実証事業評価担当 ・WG2メンバー

西山 智章 流通システム開発センター 理事 ・WG2メンバー

羽鳥 健太郎 情報処理推進機構 調査役 ・実証事業評価担当 ・WG2メンバー

元橋 一之 東京大学 教授 ・有識者委員会座長

本村 陽一 産業技術総合研究所 人工知能研究センター

首席研究員 ・実証事業評価担当 ・WG2座長

渡辺 努 東京大学 教授

【審議協力者】

氏名 所属 役職 備考

西郷 浩 早稲田大学 教授 ・審議協力者

本委員会には、オブザーバーとして、以下の組織が参画した。

【オブザーバー(関係省庁等)】

内閣府 政策統括官(経済財政分析担当)付参事官(総括担当)付

内閣府 経済社会総合研究所国民経済計算部企画調査課

総務省 大臣官房企画課政策室(総務大臣補佐官室)

Page 6: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

4

総務省 統計局統計調査部調査企画課

総務省 政策統括官(統計基準担当)付統計審査官室

日本銀行 調査統計局

【オブザーバー(関係団体)】

大手家電流通協会

日本百貨店協会

日本フランチャイズチェーン協会

日本チェーンストア協会

日本スーパーマーケット協会

日本ドゥ・イット・ユアセルフ協会

日本チェーンドラッグストア協会

本委員会においては、実証事業、ワーキンググループ、包括的調査に係る進捗や成果の報告等

を受け、それらの内容について助言等を行うとともに、「経済産業統計の一層の向上に向けたビッ

グデータ活用の提言(案)」の取りまとめに向けた検討、討議を行った。

本委員会で取りまとめた提言(案)は別添資料1として添付している。

Page 7: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

5

4.新指標への活用に向けた包括的調査

国内調査は主として机上調査を行い、海外調査は主として訪問調査を実施した。

日本国内の動向としては、2016年6月に閣議決定された「経済財政運営と改革の基本方針

2016(骨太方針 2016)」において、「経済統計の改善」として、

① 総務省は、統計委員会が取りまとめた取組方針に基づき、関係府省庁の協力を得て、統計の精

度向上に取り組むこと

② 経済財政諮問会議において、統計委員会と連携しつつ、「行政記録情報やビッグデータなどの

新たなデータ源についての効率的な活用の推進」等、政府の取組方針を年内に取りまとめること

等が明記されている。

また、同年12月21日には経済財政諮問会議において、新たなデータ源の活用の推進につき、

「統計改革の基本方針」の中の一つとして以下が決定された。

・ビッグデータを活用した経済指標等の開発に当たっては、景気動向把握の向上に資するよう考

慮するとともに、既存統計では把握できない経済活動の把握に努める。 (関係府省)

・ビッグデータを用いた新たな景気動向のための指標として、POSデータをきめ細かく分析に

利用する手法の開発に向けた検討を行う。

また、物流データを活用した地域間の移出入の動向把握に向けて、調査機関と連携して研究を

進める。 (内閣府)

これを受け、関係府省において、早期かつ精緻な景気動向把握に資するビッグデータの活用の

促進やビッグデータ活用に関する環境・体制整備等の課題への取組が本格的に始まったところで

ある。他府省における具体的な取組としては、以下のような取組が挙げられる。

① 総務省 速報性のある包括的な消費関連指標の在り方に関する研究会

② 総務省 統計委員会 横断的課題検討部会

③ 総務省 統計局 家計調査の改善に関するタスクフォース

④ 内閣府 より正確な景気判断のための経済統計の改善に関する研究会

⑤ 内閣府 EBPMのニーズに対応する経済統計の諸課題に関する研究会

海外の動向調査は、先ずはグローバルでの最新の動向を把握するため、多数の国が参画してい

る国際機関の統計関連部局である、国際連合統計部(UNSTATS)、ならびに、欧州連合統計局

Page 8: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

6

(EUROSTAT)に対する訪問調査を実施した。

国際連合統計部(UNSTATS)や欧州統計局(EUROSTAT)などの国際機関における取組は、

協力の得られた個別の民間企業の保有データを用いた限定的な実証実験の域を出ておらず、その

有用性や社会還元のあり方を模索している段階にある。

新たに統計へ活用するデータとして、UNSTATS では Mobile phone data、Social media、

Satellite imagery等、EUROSTATではWeb scraping (イギリス、イタリア等でパイロット事

業を実施)、Smart meters(エストニア、オーストリア、デンマーク等でパイロット事業を実施)、

AIS1 data(オランダ、デンマーク等でパイロット事業を実施)、Mobile phone data(ベルギー、

エストニア等でパイロット事業を実施)等に着目している。

UNSTATS では、事業において開発したツール等を発展途上国向けに提供することで、当該諸

国の関連する取組への投資額を低減することが、また、EUROSTAT では、産業界からのデータ

提供を促すため、ビッグデータでトレンドを検知するなど、新たなデータソースを使うことに慣

れてもらい、産業界のマインドセットを変えていくことが、重要な意義を持つことと認識してい

る。

また、UNSTATS、EUROSTAT ともに、ビッグデータ活用の基準やプラットフォーム等が乱立

することで、社会全体としての効率性が損なわれることを懸念しており、公的機関が民間に先行

してビッグデータの活用ノウハウや有用性の検証、基準の策定等を主導していくべきだと認識し

ている。

1 Automatic Identification System:自動船舶識別装置

Page 9: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

7

第1章 本事業の目的および全体方針

1.本事業の目的

現下の経済情勢の変化速度は、グローバル化・IT化などによる経済主体の範囲拡大や意思決定・

取引活動の迅速化等を通じて、急激に速まっている。

そのため、政府としてもマクロ・ミクロの経済情勢・景気概況やそれらの相関性等の把握のた

めには、従来からの大まかな属性(産業別、地域別等)ごとの集計で公表までに一定の期間が必

要な政府統計・業界統計や、定性的な企業等からのヒアリング情報だけでは十分でなくなりつつ

ある。こうした現状を補完するため、最近の IT技術の進展により活用が可能となって来た民間等

保有のビッグデータを基にした、新たな速報性の高い「ナウキャスティング(Now-casting、足

元予測)」・「フォーキャスティング(Forecasting、将来予測)」や膨大な相関分析といった分析手

法(アナリティクス)による、マクロ・ミクロの新指標を開発する期待・実現性が急速に高まっ

ている。

本事業では、民間企業が保有するPOSデータ、サイバースペース上に蓄積されているブログ

や Twitter を始めとしたソーシャルネットワーキングサービス(SNS)等の書き込み、政府等

行政機関が保有する統計情報や行政記録情報等のビッグデータについて、解析技術やAI技術等

を活用して分析を行うことで、既存の政府統計の補完、拡充、詳細化を実現し、従来の統計より

も速報性に優れた指標を開発して、政府においては迅速で正確な景気判断・政策決定を、民間に

おいては迅速で的確な経営判断・意思決定を可能とすることを目的とする。

Page 10: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

8

2.全体方針

(1)ビッグデータを活用した新指標開発実証事業の実施

本事業では、上述の本事業の目的の実現に向けて、ビッグデータとその解析技術を活用した新

指標の算出、公開の仕組みの構築やそのための基盤整備に向けた実証事業を実施した。

具体的には以下ⅰ)からⅵ)の6テーマについて実証事業を実施した。

ⅰ)POS等のビッグデータの収集・加工・維持・提供

個人情報とは紐付かない小売各業態のPOSやeコマースの販売ログデータ等を収集、加工し、

ⅲ)POS等のビッグデータを活用した新指標開発、及びⅴ)POS、SNS等のビッグデー

タ、及び政府統計等を組み合わせた新指標開発と連携して加工済みデータの維持、提供を行う。

なお、対象としたPOS等データの種類、及び対象期間は以下のとおり。

・家電大型専門店:2014年1月~2016年12月

・コンビニエンスストア:2016年10月~12月

・スーパーマーケット:2016年10月~11月

・ドラッグストア:2016年10月~11月

・ホームセンター:2016年10月~11月

ⅱ)SNS等のビッグデータの収集・加工・維持・提供

ブログや Twitter を始めとしたSNS等、サイバースペース上に蓄積されている大規模公開情

報を収集、加工し、ⅳ)SNS等のビッグデータとその解析技術を用いた新指標開発・評価・

検証、及びⅴ)POS、SNS等のビッグデータ、及び政府統計等を組み合わせた新指標開発

と連携して加工済みデータの維持、提供を行う。

なお、対象としたSNS等、及び対象期間は以下のとおり。

・国内主要ブログポータル(日本語):2007年1月~2017年2月

・ツイッター(日本語):2007年9月~2017年2月

ⅲ)POS等のビッグデータを活用した新指標開発

ⅰ)POS等のビッグデータの収集・加工・維持・提供と連携し、家電大型専門店を含む業種

のPOS等のデータを活用し、既存の政府統計(商業動態統計調査)を代替・補完し、更に経

済現象を捉える極めて高い速報性を有する指標の開発を行う。

ⅳ)SNS等のビッグデータとその解析技術を用いた新指標開発・評価・検証

ⅱ)SNS等のビッグデータの収集・加工・維持・提供と連携し、ブログや Twitter を始めと

したSNS等、サイバースペース上に蓄積されている大規模公開情報を利用し、AI技術を活

Page 11: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

9

用した言語処理等を活用して、ダイナミックに変動する経済現象を捉える高い速報性を有する

指標の開発、評価、検証を行う。

ⅴ)POS、SNS等のビッグデータ、及び政府統計等を組み合わせた新指標開発

ⅰ)POS等のビッグデータの収集・加工・維持・提供、及びⅱ)SNS等のビッグデータの

収集・加工・維持・提供と連携し、POS、SNS等のビッグデータ、及び政府等行政機関が

保有する統計情報や行政記録情報等(気象情報などオープンデータ)等を利用し、より付加価

値の高い新たな指標をコンテスト形式で開発する。

ⅵ)新指標の算出・公開サービスの実装・提供

ⅱ)で収集・加工されたビッグデータ、及びⅳ)で開発されたアルゴリズムと連携を図り、新

指標の算出自動化の仕組みを構築する。

なお、以上の6テーマは、何れも専門的知見を必要とするため、各実証事業を実施する者(以

下、「再委託事業者」)を選定し、再委託事業者との間で委託契約を締結して実施した。

① 実証事業の選定及び契約締結

経済産業省と協議の上、各実証事業の課題設定を行った。

再委託の予算額については実証事業内容に応じて、経済産業省と協議のうえ決定した。

② 実証事業評価委員会の設置

再委託事業の実施に際しては、外部有識者から成る評価委員会を設置し、各実証事業の

個別評価を行うと共に、事業全体について指導・助言・評価等を行った。

評価委員は、統計学、経済学、人工知能、ビッグデータに関する有識者4名で構成した。

公正性、公平性確保の観点から、評価期間を十分確保するとともに、評価点の異常値の

排除や、評価者の選定において再委託事業者との関係を精査した。

③ 実証事業に対する指導、助言、進捗管理等

実証事業の適切な実施のため、実証事業に対する指導・助言、進捗状況の管理を行った。

実証事業を管理する担当者(以下、「実証事業管理担当者」)を配置し、再委託事業者に

対し随時適切な指導、助言を行った。また、隔週1回程度実証事業の進捗状況の確認、

会計等の管理を行い、必要に応じて、現地に赴く等の方策により、指導、助言を行うと

もに、事業の進捗状況等については、経済産業省へ報告を行った。

再委託契約期間終了後、実証事業管理担当者及び会計処理担当者の2名により、確定検

査を行った。

再委託事業者から提出された実証事業に関する報告書は別添資料2のとおり。

Page 12: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

10

(2)有識者委員会の運営、及び新指標への活用に向けた包括的調査事業の実施

① ビッグデータの利活用に関する有識者委員会の運営

平成27年度「ビッグデータとその解析技術を活用した新指標の開発事業(プラットホーム構

築検討)」における研究会での検討・とりまとめ内容を受けて、(1)②における評価委員4名と

検討会の開催に必要な専門委員5名および審議協力者1名を選定して有識者委員会(下部組織の

WGを含む)を設置し、ビッグデータの統計作成業務への利活用、活用に必要となる規制・ルー

ル整備、政府統計用品目マスター管理手法等について、検討を行い、経済産業統計の一層の向上

に向けたビッグデータ活用の提言(案)を取りまとめた。

また、政府統計用品目マスター管理手法など、より詳細な検討が必要な個別テーマの議論に当

たって、規制・ルール整備とマスター・システム整備の検討を行う2つのWGを設置し、より詳

細な検討を実施した。

有識者委員会、実証事業評価委員会、WGの位置づけは以下のとおり。

② ビッグデータの利活用に向けた包括的調査事業の実施

(2)①の有識者委員会等での検討結果、再委託事業の状況及び成果を踏まえ、さらに深く追

求すべき事項や大局的に捉える事項について、POSデータ、SNSデータの他、センシングデ

ータなどの IoT データ等のビッグデータの利活用に向けた基盤整備に関わる課題を抽出し、課題

の整理及び対応策について整理・分析を行い、包括的な調査を実施した。

図表 3:各委員会等の位置づけ

Page 13: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

11

(3)成果のとりまとめ・普及活動

① 成果のとりまとめ

(1)~(2)の各事業の成果を取りまとめるとともに、評価委員会、有識者委員会での検討

の結果等を踏まえ、技術的・制度的観点から、POS、SNS、IoT データ等のビッグデータ、

及び政府統計や各種行政記録情報等のオープンデータ等を活用した経済産業統計の一層の向上に

向けた提言案を取りまとめ、報告書を作成した。

② 普及活動

当該報告書は、事業終了後に経済産業省に提出するとともに、成果報告会の開催等を通じて、

広く広報していく。

また、本事業により得られた知見等については、経済産業省の了承を得たうえ、ポータルサイ

ト等を通じて広く周知する。

以上、(1) ビッグデータを活用した新指標開発実証事業の実施、(2) 有識者委員会の運営、

及び新指標への活用に向けた包括的調査事業の実施、(3)成果のとりまとめ・普及活動にて記載

した事業全体のイメージは以下のとおりとなる。

図表 4:事業全体イメージ※再掲

Page 14: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

12

第2章 ビッグデータを活用した新指標開発実証事業

1.実証事業の選定

本事業においては、公募等により以下のとおり再委託事業者を選定した。

ⅰ)POS等のビッグデータの収集・加工・維持・提供

ジーエフケーマーケティングサービスジャパン株式会社(以下、「GfK」又は「GfKジャパン」)

ⅱ)SNS等のビッグデータの収集・加工・維持・提供

株式会社エヌ・ティ・ティ・データ(以下、「NTTデータ」)※Twitterデータ

株式会社ホットリンク(以下、「ホットリンク」)※ブログデータ

ⅲ)POS等のビッグデータを活用した新指標開発

GfKジャパン

株式会社インテージリサーチ(再々委託先:株式会社インテージテクノスフィア)、株式会社イ

ンテージ(3社を合わせ以下、「インテージ」)

ⅳ)SNS等のビッグデータとその解析技術を用いた新指標開発・評価・検証

野村證券株式会社(以下、「野村證券」)

ⅴ)POS、SNS等のビッグデータ、及び政府統計等を組み合わせた新指標開発

NTTデータ(再々委託先:公益財団法人流通経済研究所(以下、「流通経済研究所」))

ⅵ)新指標の算出・公開サービスの実装・提供

野村證券

なお、再委託先事業者の公募は2016年9月9日から9月30日まで実施し、10月6日に

実証事業評価委員会による再委託先公募に係る提案内容技術審査を行ったうえ、10月11日に

公募による再委託先事業者を決定した。

Page 15: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

13

実証事業全体のイメージと各事業の再委託事業者等は以下のとおり。

図表 5:実証事業全体イメージ※再掲

Page 16: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

14

2.実証事業評価委員会の開催

本事業における実証事業評価委員会の委員は以下のとおり。(五十音順、敬称略)

氏名 所属 役職

小西 葉子 経済産業研究所 上席研究員

佐藤 忠彦 筑波大学 教授

羽鳥 健太郎 情報処理推進機構 調査役

本村 陽一 産業技術総合研究所 人工知能研究センター

首席研究員

上述の4名の委員により、以下のとおり、再委託先事業提案内容技術審査1回と、4回の評価

委員会を開催した。

・再委託先事業提案内容技術審査

日時:2016年10月6日(木曜日)

場所:経済産業省 別館1階 共用会議室101-2

・第1回 評価委員会

開催日:2016年11月7日(月曜日)

場所:経済産業省 別館1階 104各省庁共用会議室

・第2回 評価委員会

開催日:2016年12月13日(火曜日)

場所:経済産業省 別館1階 共用会議室101‐2

・第3回 評価委員会

開催日:2017年 1月19日(木曜日)

場所:経済産業省 別館1階 共用会議室103

・第4回 評価委員会

開催日:2017年 3月 8日(水曜日)

場所:経済産業省 別館1階 共用会議室101-2

Page 17: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

15

3.実証事業結果概要

(1)データの収集・加工・維持・提供に係るもの

1.実証事業の選定に記載のとおり、実証事業ⅰ)POS等のビッグデータの収集・加工・維

持・提供は GfKジャパンを、実証事業ⅱ)SNS等のビッグデータの収集・加工・維持・提供は、

NTT データ(Twitter データ)およびホットリンク(ブログデータ)を再委託事業者として選定

した。各再委託事業者による実証事業の実施結果概要は以下のとおり。

① GfKジャパン

家電大型専門店等よりPOSデータを収集、以下に記載のとおり加工・提供を行った。

・実証事業 ⅲ) 向け

対象期間 2014年1月~2016年12月

時系列区切り 月次、週次、日次

対象地域 日本全国(都道府県別)

商品分類単位 家電製品103分類

データ項目 数量、金額、平均価格、店舗数

・実証事業 v) 向け

対象期間 2014年1月~2015年12月

時系列区切り 週次

対象地域 日本全国(以下の5地区別)

■北海道・東北

北海道/青森/秋田/岩手/山形/宮城/福島

■関東・甲越

栃木/茨城/群馬/新潟/山梨/東京/神奈川/千葉/埼玉

■東海・北陸

愛知/岐阜/三重/静岡/長野/石川/福井/富山

■近畿

大阪/京都/兵庫/滋賀/奈良/和歌山

■中国・四国・九州 ・沖縄

広島/岡山/山口/島根/鳥取/香川/高知/愛媛/徳島/

福岡/佐賀/長崎/大分/熊本/宮崎/鹿児島/沖縄

商品分類単位 家電製品103分類

データ項目 数量、金額、平均価格

Page 18: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

16

② NTTデータ

Twitterデータを収集、以下に記載のとおり加工・提供を行った。

・実証事業 iv)、v) 向け

対象期間 2008年1月~ 2017年2月

時系列区切り 日次

対象範囲 プライベートアカウントのツイート・ダイレクトメッセージを除く

全ての日本語ツイート

加工条件 特定の期間内、特定のキーワードを含む(含まない)等、再委託事

業者等の要望に応じた加工を実施

③ ホットリンク

ブログデータを収集、以下に記載のとおり加工・提供を行った。

・実証事業 iv)、v) 向け

対象期間 2007年1月~ 2017年2月

時系列区切り 日次

対象範囲 アメーバブログ、livedoor blog、Yahoo!ブログ、seesaaブログ、楽

天ブログ、はてな Diary、goo ブログ、エキサイトブログ、ココロ

グ、ヤプログ、FC2 ブログ、ウェブリブログ、DTI ブログ、

LOVELOG、ジュゲムを含む主要なブログポータル

加工条件 特定の期間内、特定のキーワードを含む(含まない)等、再委託事

業者等の要望に応じた加工を実施(加工条件に合致するブログの記

事数を提供することも可能)

Page 19: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

17

(2)新指標の開発等に係るもの

1.実証事業の選定に記載のとおり、実証事業ⅲ)POS等のビッグデータを活用した新指標

開発は GfKジャパンおよびインテージを、実証事業ⅳ)SNS等のビッグデータとその解析技術

を用いた新指標開発・評価・検証は野村證券を、実証事業ⅴ)POS、SNS等のビッグデータ、

及び政府統計等を組み合わせた新指標開発は NTTデータ/流通経済研究所を、実証事業ⅵ)新指

標の算出・公開サービスの実装・提供は野村證券を再委託事業者として選定した。

各再委託事業者による実施内容(実証事業)の概要とその趣旨は以下のとおり。

各再委託事業者が実施した実証事業の実施結果の概要は以下のとおり。

Page 20: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

18

① GfKジャパン 実証事業報告(概要)

【商業動態統計との定義差異等に係る調整】

商業動態統計の作成担当課室へのヒアリング、丁2調査票の個票情報の確認などを行い、以下

のとおり、A.集計分類の調整およびB.集計対象企業の調整を行った。

<A.集計分類の調整>

ヒアリング等を行った結果、GfKジャパンが既に収集、加工し、保有しているデータ(GfK標

準データ)と商業動態統計(丁2調査票)との間には以下のとおり分類定義の差異があることが

判明したため、GfK標準データから商業動態統計の分類に合わせるための調整を行った。

(表 1)

図表 6:分類定義の差異

Page 21: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

19

図表 7:商業動態統計の家電大型専門店販売で用いられている商品分類

<B.集計対象企業の調整>

商業動態統計(丁2調査票)の個票との突合せを行うことにより、GfK 標準データと商業動態

統計が対象とする集計対象企業に差異があることが判明したため、集計対象企業の調整を行い、

チェーンレベル(企業グループの単位)において、商業動態統計と対象企業を一致させた。

以上の調整等を行い、以下のとおり、集計対象企業、地区別の区分、商品分類定義を、商業動

態統計と可能な限り合致させた商動比較用再検証データを作成した。

Page 22: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

20

【商業動態統計(家電大型専門店販売)との比較】

前述の商動比較用再検証データ(以下、「GfK POSデータ」)と、商業動態統計における家電大

型専門店販売額(丁2調査票)とを、2015年11月~2016年10月の12か月間を対象

期間として比較した。比較結果は以下のとおり。

全体(全国、商品分類6分類の合計)の値においては、商業動態統計の値を100%としたと

き、GfK POSデータの値はその88%に相当し(GfK POSデータの方が12%小さく)、金額に

して5,000億円程度の差異が発生している。

商品分類別に見ると、商業動態統計を基準とした割合では、「その他」の差異が最も大きく、次

いで、「カメラ類」の差異が大きい。なお、販売額では、「その他」の分類の差異が最大で全体の

過半を占めており、次に差異が大きいのは「情報家電」となる。

また、以下に示すとおり、販売金額指数の月次トレンドにおいては、商業動態統計と GfK POS

データとの間に大きな相違は見られなかった(商業動態統計より GfK POS データが約9%~1

4%小さい)。なお、前年同月比を比較した場合、正負の符号(増減)は一致していた。

図表 8:商業動態統計(家電大型専門店)との販売額の差異

Page 23: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

21

【商業動態統計との差異要因の検証】

差異が発生する要因について検証を行った結果、以下のとおり、GfK POSデータの値が商業動

態統計の値より大きくなる(増加させる)要因と、小さくなる(減少させる)要因の双方が推定

された。

・増加させる要因

イ.フランチャイズ店(FC店)販売実績集計の有無

ロ.携帯電話専門店・キャリアショップ販売実績集計の有無

ハ.携帯端末の価格基準の違い(一括販売、割賦販売など)

・減少させる要因

ニ.家電大型専門店通信販売実績集計の有無

ホ.「その他」分類に含まれる商品(非家電製品等の集計の有無)

へ.アウトレット/中古商品販売実績集計の有無

ト.法人向けアカウントでの販売実績集計の有無

チ.集計対象外製品(パーツ類等商品POSマスターがない細かな商品の集計の有無)

リ.工事費や設置費の販売実績集計の有無

以上の合算(相殺されたもの)により、先述の12%の差異が発生していると考えられる。

なお、この内最も影響が大きい要因である「ホ.「その他」分類に含まれる商品」と、「ニ.家

図表 9:商業動態統計との比較:月次トレンド(販売金額指数)

Page 24: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

22

電大型専門店通信販売実績集計の有無」が、差異の大部分を占めていることが推定された。

【差異の解消に向けた解決手段】

上述の9つの差異要因を次の3課題に分け、それぞれの解決手段を検討した。

<課題1:店舗形態に起因する課題>

イ.フランチャイズ店(FC店)の販売実績集計の有無

ロ.携帯電話専門店等販売実績集計の有無

ト.法人向けアカウントでの販売実績集計の有無

<解決手段1>

店舗形態に起因する課題については店舗別データの集信を行うことにより解決可能と考えられ

る。家電大型専門店から店舗別、アカウント別(法人アカウント等を識別)のデータを収集し、

仕分けを行うことで、商業動態統計の数値により近似させることが可能と考えられる。

なお、店舗別、アカウント別データを集計することにより、既存店の販売動向が分析できると

いう副次的な効果がある。

家電販売市場を分析する指標が増えるのとともに、家電大型専門店に店舗展開や人員配置等の

戦略立案に有益な指標をフィードバックすることができるなどのメリットが期待できる。

<課題2:通信販売に起因する課題>

ニ.家電大型専門店通信販売実績集計の有無

<解決手段2>

通信販売に起因する課題については家電大型専門店からインターネット販売等通信販売分の販

売実績データを収集し、販売動向データとして集計することにより解決可能である。

なお、家電大型専門店企業においては、テレビ通販、カタログ販売等、その他の通信販売形態

の比率は極めて少なく、インターネット販売分を集計することで、通信販売実績集計の有無に起

因する課題は解決すると想定される。

<課題3:商品定義に起因する課題>

ハ.携帯端末の価格基準の違い

ホ.「その他」分類に含まれる商品

Page 25: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

23

へ.アウトレット/中古商品販売実績集計の有無

チ.集計対象外製品

リ.工事費や設置費の販売実績集計の有無

<解決手段3>

商品定義に起因する課題については商品定義の設定とマスター整備によって解決可能である。

集計対象とする商品の定義を厳密に設定し、それに従ってPOSデータのマスターを整備する

ことにより、集計対象の商品と対象外の商品を識別、高い精度で販売動向データを集計すること

が可能となる。

以上、3つの課題と解決手段を取りまとめると以下のとおりとなる。

【POSデータの特性を活かした新たな指標の可能性】

本事業においては、商業動態統計との比較、検証に加え、POSデータの特性を活用した付加

価値の高い新指標の開発可能性を探るため、以下に示すとおり、商品分類細分化、販売数量・平

均単価への要素分解、タイムライン細分化等を行った。

<商品分類細分化>

AV家電などの、商業動態統計の商品分類別販売額の前年比を、テレビ、プロジェクタなどの

Page 26: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

24

より詳細な商品別に細分化することで、カテゴリーの動態をより精緻に捉えることを目指す。

実際に該当商品分類の販売額の動きに大きく寄与している製品群が明らかになり、結果、従来

よりも商業動態の実態に即した指標が得られることが期待される。

使用したデータの条件は以下のとおりである。

使用データ GfK ジャパンが収集しているPOSデータの内、日本標準産業

分類に掲げる細分類 5931-家電機械器具小売業又は細分類

5932-電気事務機機械器具小売業(中古品を除く)に属すると

想定される家電大型専門店を集計。各企業内の同一POSネッ

トワーク上に存在する店舗(ただし、法人アカウント、通信販

売専用アカウントは除く)において、商業動態統計の内容例示

を網羅した分類定義により集計された販売動向データ。

対象商品分類 AV家電

対象商品部類に属する商品

名称(内容例示)

テレビ、プロジェクタ、ビデオディスク、BD・DVD(再生専用、

録画再生機)、BS・CS 機器、ステレオ、スピーカ、AV 編集機

器、ラジオ・ポータブルオーディオ、GPS ナビゲーション、ヘ

ッドホン、マイクロホン、AV接続機器、電子楽器、

VTR、携帯オーディオ機器、ホームオーディオ機器、他オーデ

ィオ関連、メディアクリーナ、その他 AV家電(~等)

データ期間 2015年12月~2016年11月

使用値 月次販売金額

上記のデータ条件に従う場合、商品カテゴリーの販売金額前年比は2015年12月から20

16年11月までの12か月分を得る。また各商品の販売金額の月次差分も同様である。

2015年12月から2016年11月までにおける「AV家電」の販売金額前年比に対する

各商品の寄与度を図示したものを以下に示す。

Page 27: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

25

図表 10:AV家電の販売金額前年比と各商品の販売金額の寄与度

AV家電の販売金額前年比の折れ線グラフから、2016年3月と同年8月において、AV市

場の販売金額が前年から特に落ち込んだ様子が読み取れる。さらに商品別寄与度を表す棒グラフ

をみると、2016年3月の落ち込みは特にテレビ販売の下落が主要因であり、同年8月はテレ

ビに加えて携帯オーディオ機器の販売下落も大きな要因であるとの実態が確認できる。

このように、商品分類を細分化することによって、商業動態の実態を従来よりも明確に捉える

ことが可能になる。

<販売数量・平均単価への要素分解>

商業動態統計の調査対象である販売額を販売数量と平均単価の積に要素分解することにより、

商業動態の変化について新たな視点を与える。

家電製品市場では、販売数量データがシーズナリティ(季節に伴う変動)を持つことや新製品

の発売によって平均単価が変化することは珍しくない。

したがって、販売額の変動を理解するうえで販売数量と平均単価は欠かせない要素と言える。

Page 28: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

26

使用したデータの条件は以下のとおりである。

使用データ GfK ジャパンが収集しているPOSデータの内、日本標準産業

分類に掲げる細分類 5931-家電機械器具小売業又は細分類

5932-電気事務機機械器具小売業(中古品を除く)に属すると

想定される家電大型専門店を集計。各企業内の同一POSネット

ワーク上に存在する店舗(ただし、法人アカウント、通信販売専

用アカウントは除く)において、商業動態統計の内容例示を網羅

した分類定義により集計された販売動向データ。

対象商品名称 テレビ

データ期間 2015年12月~2016年11月

使用値 月次販売金額、月次販売数量、月次平均単価

2015年12月から2016年11月までにおけるテレビの販売額前年比に対する販売数量

と平均単価の寄与度を図示したものを以下に示す。

図表 11:テレビの販売額前年比と数量変化・価格変化の寄与度

上図の赤い棒グラフは各月の販売金額前年比に対する販売数量変化の寄与度を、緑色の棒グラ

フは平均単価変化の寄与度をそれぞれ表している。この図から3月と7月の金額変動は数量に起

因するところが大きいことや、6月における販売金額前年比の成長は平均単価の上昇に起因して

いることなどが分かる。

Page 29: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

27

さらに、販売数量や平均単価の変動をみることの有効性は、単月毎の寄与度を知るだけにはと

どまらない。

例えば、販売数量データを長期的な時系列データとしてみるならば、移動平均を算出すること

によって分析対象製品の商業動態のトレンドを知ることも可能である。

<タイムライン細分化>

タイムラインを更に細分化し、日次データの活用による分析事例を提示する。

使用したデータの条件は以下のとおりである。

使用データ GfK ジャパンがクライアントに定期的に配信している標準デ

ータ(GfK 標準データ)を使用。GfK ジャパンの定義による

家電販売店企業、各企業内の同一POSネットワーク上に存

在する店舗(ただし、法人アカウント、通信販売専用アカウ

ントは除く)が対象。

対象商品名称 カメラ類

データ期間 2015年4月25日~2015年5月8日、

2016年4月25日~2016年5月8日

使用値 日次販売金額

2015年、2016年の大型連休期間におけるカメラ類の販売金額推移は以下のとおり。

図表 12:2015年の大型連休期間中におけるカメラ類の日別販売金額指数

※4月27日の販売金額を100として指数化

Page 30: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

28

図表 13:2016年の大型連休期間中におけるカメラ類の日別販売金額指数

※4月25日の販売金額を100として指数化

2015年、2016年ともに休日の販売金額は、平日の1.5倍以上になっていることが分

かる。ただし、2015年が大型連休突入前の週末の販売のピークが来ているのに対し、201

6年は4月29日に販売のピークが来ている。また、2016年は平日である4月28日も高い

販売指数を示している。みどりの日である4月29日が金曜にあたり、そのまま週末に差し掛か

るカレンダーの並びだったため、4月28日から休暇に入った人も多かったものとみられる。

以上のように、タイムラインを日次に細分化することで、曜日別の販売動向の違いや、カレン

ダーの並びによる販売動態の変化など、これまで見えなかった動態の分析が可能となる。

【総括】

差異要因の解消手段については、システム構築やマスター整備などで解決できる課題と、家電

大型専門店等との調整が必要な課題に分かれるが、どちらも解決に必要な手段は明らかとなった。

一方、携帯端末の価格基準など既存の調査手法では精緻に集計することが難しい要素について

は、新たな定義を厳密に設定するなどし、それに応じたマスターを整備した上でPOSデータに

よって集計するなどの可能性が考えられる。

なお、今回の実証事業において、POSデータにより集計された指標は速報性、詳細性に優れ

ており、官民双方にとって高い利用価値を生み出す可能性があることが明らかとなった。

さらに、POSデータ収集から集計まで自動化されたプロセスで完了することが出来れば、調

査回答者や商業動態統計作成担当者の負担軽減にも繋がることが見込まれる。

Page 31: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

29

② インテージ 実証事業報告(概要)

【POSデータの収集・加工・蓄積プロセスの実証実験】

本事業においては、インテージにて収集しているPOSデータのうち、コンビニエンスストア

業態に属する約1,000店舗のPOSデータを利用し、チェーン別×店舗別×JANコード別×

日別の販売金額、販売個数の集計を行った。

収集したPOSデータは、データクリーニングを行うが、基本的には集計不可な異常データ(チ

ェーン不明、店舗不明(店舗マスターのアンマッチ)、販売金額・個数不明)のみ除外する。

なお、JANコードについては「インテージ SRI」の商品マスターを用いるため、商品マスタ

ーとのアンマッチは全て「不明」とした。

データクリーニングを行った販売金額、販売個数の集計データは、ファイル転送サービスを経

由して経済産業省に送信され、ファイルが転送された時点で、経済産業省にその旨の通知が行く

仕組みとなっている。

図表 14:POSデータの収集・加工・蓄積プロセス

POSデータの収集、加工から、経済産業省への送信まで、何れの処理も自動化することで、

販売日翌日にPOSデータ収集を開始し、以降データチェック及び集計処理を行い、販売日の4

日後午前には集計データを経済産業省に提出することができた。なお、各処理は受信後2日間で

実施しており、技術的には3日後に提供することも可能である。

(対象期間(販売日):2016年12月5日~2017年1月2日)

チェーン・店舗別×販売日別×JANコード別に集計処理したレコード件数は、以下に示すとお

り、1 日当り約84万~約96万レコードで推移しており、平均すると1日あたり約92万レコ

ードとなった。1店舗あたりでは、1日平均約900レコードとなっている。

Page 32: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

30

土日 土日 祝日・土日 年末年始休み

今回の対象期間においては、平日の月曜から金曜にかけてレコード件数は徐々に増加し、土日

祝日に減少する傾向が見られ、最も少ない日と最大の日で1割強の増減幅があった。

また、チェーン・店舗別×販売日別×JANコード別に集計処理したデータファイル容量は、以

下に示すとおり、4チェーン約1,000店舗合計で 1 日あたり約191MB~約236MBで

推移しており、平均すると1日あたり約216MBレコードとなった。1店舗あたりでは、1日

平均約212KBとなっている。

土日 土日 祝日・土日 年末年始休み

なお、商業動態統計が対象としているコンビニエンスストアの店舗数はおおよそ55,000

店舗(2017年1月)であり、単純に上述の1日あたりの平均データファイル容量を基に計算

すると、コンビニエンスストアの業態で、1日平均約12GBという値となる。

図表 15:総データレコード件数の推移

図表 16:総データ容量の推移

Page 33: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

31

【既存サービスにおける処理工程、工数等】

インテージが自社ビジネスとして展開しているサービスである「インテージ SRI」における、

データクリーニング等の処理工程を洗い出し、各処理にかかる工数、処理時間等を参考情報とし

て提示する。

「インテージ SRI」では、小売事業者からPOSデータを収集後、データの収集状況のチェッ

ク、販売データとしてエラー等の除外チェックを行い、ローデータが作成される。

小売事業者からのPOSデータ収集は基本的には自動的に行われており、365日24時間常

時、小売事業者からのPOSデータの送信、インテージ側でのPOSデータ受信が行われている。

収集したPOSデータは、調査設計の店舗からの回収が行われているか、店舗別×販売日別の回

収状況チェック(集信状況チェック)が行われ、対象店舗のPOSデータと確認されれば、デー

タクリーニングの処理(販売データチェック)が行われる。

データクリーニング処理は随時行われているが、最短の処理期間は、日曜日分のデータを翌月

曜日に収集後、1日後の火曜日までにデータクリーニングまでが完了する。

集計データが全て揃った時点で、週次集計、月次集計が行われ、週次集計については、集計用

データが作成される日の2日後には、週次集計データを利用することができる。

図表 17:インテージ SRIデータ処理プロセス概要

Page 34: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

32

<POSデータ収集の事前準備作業>

POSデータを収集する体制を整備するためには、次のような事前準備が必要となる。

イ.必要なデータ項目の確認

対象店舗から送付されるPOSデータのデータ項目を調整する。

ロ.データフォーマットの確認・調整

対象店舗から送付されるPOSデータのフォーマットを確認する。

※フォーマットは基本的に小売事業者ごとに異なる

ハ.データ送信/受取の方法の確認

小売事業者からPOSデータを送信、受信者側で受け取るための方法について確認する。

ニ.商品マスターの確認

収集するPOSデータの商品範囲に応じた商品マスターを整備する。

ホ.店舗マスターの確認

収集するPOSデータのチェーン及び店舗を識別できるような店舗マスターを整備する。

ヘ.サーバの準備

対象となるチェーン、店舗の規模に応じたサーバのスペックを設定し準備する。

<POSデータ収集時のデータチェック作業>

イ.小売事業者からのPOSデータの送信有無(受信有無)の確認を行う。

「インテージ SRI」では調査対象として設計されたチェーン、店舗のPOSデータが収集で

きているかを確認しており、集信状況はシステム的にリスト化され、オペレーターによる監

視活動を行うとともに、小売事業者ごとの集信状況リストの作成し、必要に応じて督促等を

行っている。

Page 35: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

33

<POSデータ収集後の販売データチェック作業>

イ.店舗全体のデータ

開店・閉店前セールの異常データ、システムエラーによる異常データといった異常値と思わ

れるデータを検出、可能であれば店舗側に疑義照会を行い、必要に応じてデータ修正する。

ロ.SKU2変換チェック

SKUコードとは、同じJANコードの商品でも「梱包個数が異なる」、「色が異なる」など、

在庫管理等のためJANコードとは別に付与しているコードである。

例えば、受信したPOSデータを、ある商品の6個入りのSKUコード認識で識別したが、

価格等が合わないなど実際の販売と異なるSKUコードでの送信がないかをチェックする。

状況に応じて、商品情報を補足し、コード変換処理を実施して修正する。

ハ.単価上下限エラーチェック

商品ごとに単価が高すぎる/低すぎるデータを確認し、設定値を超えた単価が出現している

場合、異常値と判断し、店舗問合せ等で確認する。

ニ.異常店チェック

1日の客数、販売個数計、販売金額計など、過去の同時期データと比べて極端に大きい/小

さいデータを自動的に抽出し、改装、閉店、システムトラブルなどの要因が無いかを個別に

調査し、店舗問合せ等で確認する。

ホ.大量販売チェック

店舗別に過去データと比べ極端に販売個数、販売金額が大きいデータを自動的に抽出し、店

舗問合せ等で確認する。

※業者による大量発注は、「インテージ SRI」の目的と異なるためデータを除外している

※システムエラーの場合もデータを除外している

ヘ.商品マスターチェック

JANコードの有効期間外のデータ有無をチェックしている。

「インテージ SRI」において、以上のイ.~ヘ.の販売データチェックを実施した際、除外し

たデータ件数は以下のとおり。

2 Stock Keeping Unit:最小管理単位

Page 36: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

34

図表 18:販売データチェックにおける除外データ

<データチェック作業に係るハード等の物理的環境>

サーバ構成 マスタサーバー2台(1台はスタンバイ)

セグメントサーバー16台で分散処理を実施

1第あたりスペック 論理コア数:32、物理コア数:16、メモリ:64GB

ストレージ

(データ領域)

マスタサーバー:151GB

セグメントサーバー:2.8TB(ミラー部分:2.8TB)

<データチェック作業の人員体制>

「インテージ SRI」の運用のため、約25名の専門スタッフが対応している。

<データチェック作業処理時間等>

データチェック工程では、毎日4人が半日程度(2~3時間)の作業を実施している。基本的

には、システムによるチェック結果の運用確認を行う。

システムによるデータチェックのうえで、目視による最終確認等が必要な場合は、社員による

確認作業を実施しており、場合によっては店舗側への確認作業も発生する。

Page 37: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

35

<商品マスターの整備状況>

インテージでは、「インテージ SRI」での利用のほか、「インテージ SCI(消費者パネルデータ)」

での利用も兼ねて、商品マスターの整備を行っている。

一般財団法人 流通システム開発センターで整備している「JANコード統合商品情報データベ

ース(JICFS/IFDB)」をベースに、そこに含まれていないプライベートブランド(PB)、

地域限定商品(日配品)等の商品を独自に収集し、JANコードを整備している。

2016年10月時点で有効である、約108万品目のJANコードを整備しており、そのう

ち、JICFS登録品目は約55%、独自に整備している品目が約45%となる。

<商品マスターの整備方法>

「インテージ SRI」の対象店舗から送信されるPOSデータに含まれるJANコード、「インテ

ージ SCI」のモニター5万人から送られる購買情報のJANコード、メーカーからの提供情報な

ど、様々な情報をもとに新製品等を把握し、ホームページや現品確認による情報収集を行い、商

品マスターを整備している。

<商品マスターの整備体制>

商品マスターの整備(登録)のため、約90名の専門スタッフが対応している。

<商業動態統計と「インテージ SRI」の実績値の比較>

商業動態統計に対する「インテージ SRI」(実績値)の販売額の割合は、以下に示すとおり、「ス

ーパーマーケット」で14%割前後、「コンビニエンスストア」で1%前後、「ドラッグストア」

で4%前後、「ホームセンター」で13%前後となっている。

Page 38: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

36

また、商業動態統計が対象とする店舗数とインテージ SRIの対象店舗数は以下のとおり。

商業動態統計調査

(2016年12月)

店舗数

インテージSRI

設計店舗数

商業動態統計調査

店舗数÷設計数

合計 79,179 3,153 25.1

 スーパーマーケット計 5,080 1,119 4.5

コンビニエンスストア 55,636 762 73.0

ホームセンター/ディスカウントストア 4,273 200 21.4

ドラッグストア 14,190 1,072 13.2

(出典)経済産業省「商業動態統計調査」2016 年 12 月※「商業動態統計調査」と「インテージ SRI」の業態定義は

異なっていることに注意。

※上記表のうち「商業動態統計調査」の「スーパーマーケット」は百貨店も含む数値。

※また、「ホームセンター/ディスカウントストア」はディスカウトストアを含まない数値。

図表 19:商業動態統計とインテージ SRIの比較(販売額)

図表 20:商業動態統計とインテージ SRIの比較(店舗数)

Page 39: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

37

図表 21:商業動態統計の業態定義

図表 22:インテージ SRIの業態定義

【総括】

<小売事業者からのPOSデータの提供方法の準備>

・課題

経済産業省において、多数の小売事業者から日次など定期的かつ高頻度にPOSデータを

提供してもらうための環境整備が必要である。

企業規模や現時点での IT導入状況など、個別の小売事業者が置かれている状況が様々に異

なることが想定される。

・対応策

日次など高頻度でPOSデータを提供してもらうには、EDI3環境を用意し、小売事業者

にオンラインで提出させるための環境構築が必要である。EDIについては、標準的なも

のの検討も考えられるが、基本的には小売事業者のフォーマットと環境に応じて、個別に

対応する必要が生じる可能性がある。

3 Electronic Data Interchange:電子データ交換

Page 40: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

38

当面は、別の提出方法(データアップロード)や、従来どおり調査用紙への自記入式の手

法も残すなど、多様なデータ提出環境を用意する必要性も考えられる。

<POSデータの蓄積・データチェック等の加工・集計環境の整備>

・課題

小売事業者のPOSデータは、粒度を細かくすればするほどデータ量が膨大になる。

収集したローデータから、データチェックや各種マスターからデータを付与するなどした

加工データ、また必要な様式で集計した集計データなど、多様なデータが作成される。

これら膨大かつ多様なデータを適切・安全に保管・管理する環境が必要となる。

・対応策

小売事業者が従来は公開していないPOSデータを収集することから、機密性に十分に配

慮したデータ蓄積環境が必要である。

店舗数は、必要となる母集団数を想定したうえで、収集体制の構築が必要となる。

データ量は日々増えていくことから、クラウド環境などの利用も想定されるが、セキュリ

ティも十分考慮した環境設計が必要である。

<POSのフォーマットの多様性>

・課題

小売事業者のPOSデータのフォーマットは各社各様である。

・対応策

経済産業省で必要なデータ項目のみを整理し、それに合わせて調整したデータを小売事業

者側に作成させ提出させることも考えられる。ただし、小売事業者側の負担(システム的

な改修)も生じることから、POSデータの提出率が低下する恐れがある。

基本的には、小売事業者が提出するPOSデータのフォーマットを事前に確認し、そのフ

ォーマットでデータを受信し、経済産業省にて必要な項目のみ利用するような対応が望ま

しいと思われる。そのためも、フォーマット対応準備が必要となる。

Page 41: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

39

<商品マスター・店舗マスターなどマスターデータの整備>

・課題

POSデータにはJANコードや小売事業者独自のインストアコードが付与されており、

POSデータそのままでは商品カテゴリーの特定が難しい。

商品と同様に、店舗等もコード化されており、小売事業者ごとにどの店舗か判別しなけれ

ば、エリアの特定なども難しい。

・対応策

各社共通となるJANコードについては、小売事業者で取り扱っている全品目のJANコ

ードをマスターとして整備することが望ましい。

日次でデータを収集し、日次・週次・月次などのタイミングで集計するのであれば、マス

ターは常時、最新のものとなるような維持・管理が必要となる。

生鮮品やサービス類など各小売事業者で独自に付与しているインストアコードについては、

共通化が非常に難しいため、各社の商品コードを収集し、経済産業省にて共通コードに置

き換える必要があると考えられる。

店舗マスターも店舗開店・閉店等の情報を常時収集し、最新のものとなるような維持・管

理が必要となる。

<運用体制の整備>

・課題

POSデータの収集、データのクリーニング(販売データチェック)、集計データの作成に

ついては、システム化がなされ自動的な処理が可能となるが、システムの運用要員、デー

タチェックの目視確認(場合によっては疑義照会)、集計データの目視確認、といった要員

が必要となる。

・対応策

体制としては、小売事業者からのデータの提出・受信の「収集」に関する小売事業者との

対応・問合せ窓口、データの収集・加工・集計といったシステム的な処理プロセスを担当

し運用する組織(システム的なスキル、システムでは処理できない人的チェック・加工に

対応するスキル)、商品マスターや店舗マスターの維持・整備を担当する組織、といった体

制が必要になる。

システム、人員的にも大規模な体制が想定される。

体制の構築及び運用に当たっては、民間ノウハウを活用することも想定される。

Page 42: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

40

③ 野村證券 実証事業報告(概要)

本事業においては、A.既存の経済統計指標を代替・補完する新指標の開発・評価、B.地域

の経済活動を表す指標算出のための新手法の研究・開発、C.中小企業における景況感を表す指

標の研究・開発、D.指標の安定的な公表に向けたプロトタイプの開発を実施した。

【A.既存の経済統計指標を代替・補完する新指標の開発・評価】

<分析手順>

イ.ワード探索

マクロ指標と関連が強いと考えられる約200のキーワードを選定し、ブログデータを用

いてワードと統計指標の相関を計測。

例:「残業」を含むブログ件数と鉱工業生産指数は高い相関

ロ.AIによる選別

得られた有望ワードを含む文書の中身のテキストを解析。以降はツイートを用いる。

AIによって、ワードを含むものの無関係のツイートを除き、意味のあるツイートだけの

件数を得る。

例: 残業を含むツイートから実際に残業したことを意味するツイートを抽出。

ハ.統計指標推定モデルの作成

文書解析を行って得られた値を用いて、統計指標をリプリケイトする時系列モデルを作成。

<結果概要>

Twitterおよびブログから得られた指標を用いて、鉱工業指数を推定するモデルを開発した。

Twitterやブログは主に月次の件数を指標として用いたが、意味のあるツイートかそうでな

いかを自動で判定するなど、AI技術を活用することで精度を向上させる取り組みを行っ

た。

例えば、鉱工業指数は“残業”というキーワードを含むツイートとの相関が高いが、これは

製造業の生産量と労働者の労働時間が相関を持つためと考えられる。そこで、残業を含む

ツイートの内、“今日も残業だった”等の残業したことを意味するツイートのみを抽出し、“今

日は残業しなかった”等のツイートを除くAIを開発した。

Twitterやブログの件数を抽出するキーワードを網羅的に探索するために、約200個のキ

ーワードと各ターゲットマクロ指標の相関を算出し、それぞれのターゲットマクロ指標を

推定するためのワードを探索した。

上記のようにして得られた Twitter およびブログ指標に株価指数や為替の系列も加えて、

マルチファクターで鉱工業生産指数(以下、IIP)を推定する時系列モデルを作成した。

Page 43: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

41

Twitterやブログ指標はその他の指標と併せても高い t値を示し、Twitterやブログを使わ

ない場合と比較して高い精度で鉱工業生産指数を推定出来ることを確認した。

得られたIIPの推定値は日次で更新可能な指数であり、IIPの速報値や製造工業生産

予測指数と比較しても速報性が高く、より迅速な政策決定や投資指標としての活用が期待

される。また、速報性だけでなく、精度の面でもIIPの予測に広く用いられている製造

工業生産予測指数と比較しても自由度調整済決定係数で大きく上回っており、IIPの予

測を精度と速度の両面で改善できる可能性がある。

図表 23:IIP(水準)の各モデルによる推計

80

85

90

95

100

105

110

115

2008/12 2009/12 2010/12 2011/12 2012/12 2013/12 2014/12 2015/12

IIP(2008年12月を100に基準化)

IIP実績値

製造工業生産予測指数のみ利用したモデル

SNSを利用したモデル

図表 24:IIP(水準)の推計精度のモデル間比較

(1) 全期間

決定係数自由度調整済決定係数

製造工業生産予測指数のみ利用したモデル 81.9% 81.7%

各種時系列を利用したモデル 96.0% 95.3%

(2) 2011年4月を除く期間

決定係数自由度調整済決定係数

製造工業生産予測指数のみ利用したモデル 83.6% 83.4%

各種時系列を利用したモデル 95.9% 95.2%

Page 44: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

42

なお、日経平均や製造工業予測指数を用いずにSNS指標だけで作成した場合のグラフを下記

に掲載した。SNSファクターを選び直した場合の自由度調整済決定係数は59.5%であり、

選び直さなかった場合は34.8%であった。

図表 25:IIP(水準)のSNSのみを利用したモデルによる推計

80

85

90

95

100

105

110

115

2008/12

2009/6

2009/12

2010/6

2010/12

2011/6

2011/12

2012/6

2012/12

2013/6

2013/12

2014/6

2014/12

2015/6

2015/12

2016/6

IIP(2008年12月

を100に

基準化)

実績値

SNSのみ利用したモデル

(最適なファクターを再選択)

SNSのみを利用したモデル

(「SNSを利用したモデル」と同じSNSファクター)

ファクター 係数 t値

残業ツイート率 0.0539 1.683

ブログ[余裕_無い ない] -0.101 -1.542

ブログ[稼働_ライン] -0.0422 -2.555

ブログ[市販車] 0.0326 2.346

ブログ[解雇] 0.0428 2.477

ブログ[納車] 0.0664 1.628

ブログ[ワイン] 0.0210 0.388

ブログ[ユンケル] -0.0118 -0.841

ブログ[めでたい メデタイ 目出度い ]0.0398 1.348

ブログ[伊勢丹] 0.0450 2.206

ブログ[車検] -0.0540 -1.388

切片 -0.000600 -0.241

AIC

決定係数

自由度調整済決定係数 34.8%

-431.6

42.5%

ファクター 係数 t値

残業ツイート率 0.0223 0.875

ブログ[残業_今日] 0.324 5.700

ブログ[チャイルドシート] -0.123 -4.671

ブログ[ガソリン] -0.00850 -4.113

ブログ[貯蓄] -0.103 -3.560

ブログ[伊勢丹] 0.0561 3.330

ブログ[宝くじ] 0.0488 2.938

ブログ[死にたい] -0.131 -2.745

ブログ[売り残り] -0.0100 -2.233

ブログ[解雇] 0.0288 2.129

ブログ[リッチ] 0.0208 2.090

切片 0.00150 0.705

AIC

決定係数

自由度調整済決定係数

-476.3

64.3%

59.5%

図表 26: IIP(水準)の推計精度(SNSのみを利用したモデル)

Page 45: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

43

【B.地域の経済活動を表す指標算出のための新手法の研究・開発】

<分析手順>

イ.ツイートの取得

全ツイートから Twitter 社が無料で提供する「Streaming API」でツイートを取得。

(Streaming APIは全ツイートの 1%程度のランダムサンプリング)

ロ.AIによる抽出

イ.で得られたツイートから、景気に関するものをAIで抽出。

ハ.AIによるセンチメント評価

ロ.で得られた景気に関するツイートのセンチメントをAIで評価。

ニ.地域別集計

ハ.で得られたセンチメントを地域別に集計する手法を検討。

図表 27:分析手順イメージ

全ツイートStreaming

API景気に関するツイート

AIによる抽出(景気ウォッチャー調査)

景気センチメント

AIによるセンチメント評価(景気ウォッチャー調査)

地域別景気センチメント Twitterユーザー情

報, ツイートに含まれる地域名

<結果概要>

Twitterから景気に関するツイートを大量に取得し、センチメントを算出し、さらにこれを

地域別に集計することで、地域の景気指標を日次で補足する指標の開発を試みた。

景気に関するツイートを大量に抽出するため、景気ウォッチャー調査を学習データとして

自動的に景気に関するツイートを抽出するAIを開発した。AIによる抽出によって約

5,000/月のツイートが無料で抽出できた。これは景気ウォッチャー調査の回答数よ

り多く、地域別、産業別の集計にも有利である。

Page 46: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

44

次に、抽出されたツイートの景気に関するセンチメントを判定するAIを同じく景気ウォ

ッチャー調査を用いて学習した。AIによって評価されたセンチメントを月次で集計する

ことで、景気ウォッチャー調査DIと高い相関があることも確認できた。特に、景気ウォ

ッチャーの先行きDIとの相関は約0.89(決定係数は約79.6%)と高い。

地域に関しては、ツイートの書き込みやユーザー情報に含まれる地名からの算出を検討し

た。地名が含まれるツイートは約20%であった。都道府県レベルでは地域化も不可能で

はない件数と考えられるが、一般名詞や人名との誤認も多く見られた。精度と件数の問題

はAIによる地名特定や、ツイート件数の増加によって、改善出来ると考えられる。

本手法を発展させることで、これまでコストの面から困難であったより詳細かつ速報性の

高い地域指数の開発が期待でき、災害への対応や地方創生に関する政策をより適切に行う

一助となると期待される。

図表 28:Twitterから得られた景気指標と景気ウォッチャー調査の比較

42

44

46

48

50

52

54

56

2015年

5月

6月 7月 8月 9月 10月 11月 12月

景気ウォッチャー

現状DI

景気ウォッチャー

先行きDI

Twitter

景気

相関 現状DI 先行きDI Twitter

現状DI - 0.88 0.67

先行きDI 0.88 - 0.89Twitter 0.67 0.89 -

Page 47: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

45

【C.中小企業における景況感を表す指標の研究・開発】

<分析手順>

イ.「なずき」4によるツイートの抽出

全ツイートから「なずき」による自営業者のツイートを抽出。(「なずき」を用いず Twitter

の Streaming API のみを用いた分析も実施)

ロ.AIによる抽出

イ.で得られた自営業者のツイートから、さらに景気に関するものをAIで抽出。

ハ.AIによるセンチメント評価

ロ.で得られた自営業者の景気に関するツイートのセンチメントをAIで評価。

ニ.景況感指数の算出

ハ.で得られたセンチメントを用いて中小企業の景況感を表す指数を算出。

図表 29:分析手順イメージ

なずき* 抽出

全ツイート自営業者のツイート

景気に関するツイート

AIによる抽出(中小企業景況調査)

中小企業景気センチメント

AIによるセンチメント評価

(中小企業景況調査)

<結果概要>

中小企業景況調査で学習したAIと Twitter データを用いて、日次レベルで算出可能な中

小企業景況感指数の開発を行った。

AIは中小企業景況調査を学習データに用いて、大量のツイートから景気に関するツイー

トのみを抽出し、景気に関するツイートのセンチメント(景気にポジティブ/ネガティブ)

を評価する。

AIによって得られた景気に関するツイートのセンチメントに対して何らかの集計を行う

ことで、中小企業景況感を表す指数を得ることが出来る。

4 トータル日本語解析ソリューションなずき(https://nttdata-nazuki.jp/)

Page 48: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

46

活用の1つの例として、まずAIによって得られた各ツイートのセンチメントを単純平均

することで指数化した(中小景況センチメント)。

2つ目の例として、3ヵ月に1度公表される中小企業景況調査業況判断DI(以下、中小企

業業況判断DI)をフィッティングするようモデル化し、得られた指数(中小景況 Tweet

指数)が元の中小企業業況判断DIと高い相関があることを確認した。なお、このモデル

化には日経平均や為替といった日次で更新可能な他の指標も活用することが出来る。

いずれの指数も月次、週次、日次といったより短い期間で算出することも可能なので、従

来と比較して速報性の高い中小企業の景況感指数として用いることが可能と期待される。

開発された指数は日次で更新可能であり、かつ中小企業業況判断DIと長期的に高い相関

がある。日次かつ低コストで中小企業景況感を把握するのに有効と期待される。

図表 30:”中小景況 Tweet指数(日次)”と中小企業業況判断 DIの推移(水準)

-50

-45

-40

-35

-30

-25

-20

-15

2011/9 2012/9 2013/9 2014/9 2015/9 2016/9

中小景況Tweet指数

中小企業業況判断DI

DI

なお、AIによる抽出で得られた各ツイートのセンチメントを3月2日~6月1日、6月2日

~9月1日、9月2日~11月15日、11月16日~3月1日の各期間で平均して指数化した

中小景況センチメントにつき、2011年4月以降のツイート数が十分ある期間においては、中

小企業業況判断DIと高い相関があることを確認した。

Page 49: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

47

図表 31:中小景況センチメントと中小企業系調査 DIの推移(水準)

Page 50: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

48

【D.指標の安定的な公表に向けたプロトタイプの開発】

<指標算出に用いる Twitterのデータソース>

より低コストで大量のデータを取得する目的で、Twitter 社が提供する無料の API である

Streaming APIを用いて、自動でツイートを取得するシステムを構築し、約2週間にわたって検

証を行った。

Streaming API は Twitter社が提供する無料 APIの 1つで、全ツイートの中からランダムに抽

出された一部のツイート(public streams と呼ばれる)をリアルタイムに取得することが出来る

APIである。

ただし大きな欠点として、過去のツイートを取得することは出来ないため、過去時系列の分析

や、何らかの理由で取り逃した場合に再取得することは不可能な点が挙げられる。

Streaming APIで得られる日本語ツイートから、リツイートを除いて集計した結果、以下のと

おり約2週間弱の検証期間に2,300万を超える大量のツイートを取得でき、サーバの負荷や

記憶容量の観点からは運用が十分に可能であることを確認した。

図表 32:Streaming APIによる日本語ツイートの件数(リツイート除く、1時間毎)

なお、2017年3月15日の昼頃等、ツイート件数が急激に減少している時間帯が数回ある

が、これは何らかの理由で構築した収集システムが止まってしまったためである。

システムの見直しやバックアップ体制の準備によって改善できる可能性はあるが、取り逃した

ツイートは遡って取得できないため、指標の算出を安定的に運用する際には大きな課題となる。

Page 51: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

49

<複数データソースの組合せ(ブログデータの追加)>

指標を安定的に公表するためには、一つのデータソースに依らず、複数のソースを用いること

も重要と考えられるため、C.で作成した中小企業景況 Tweet指数にブログデータを加えた場合

の精度・安定性の変化を検証した。

ブログデータとして、「クレカ」または「クレジット」を含むブログ件数等が有効であると想定

された。これらの時系列データを中小企業業況判断DIの推計への変数として用いて分析を行っ

た結果は以下のとおりである。

本モデルの決定係数は約89.4%であり、ブログデータを用いなかった場合の約81.6%

と比較して向上している。

また、安定性の観点からは、日次変化幅の標準偏差は10.9%から8.7%に減少しており、

平均的な日々の変動幅も減少していることが分かった。

なお、ブログデータ追加の場合の中小企業業況判断DIにおいても、指標の意味やアウトサン

プルでの精度向上を検証する必要はある。

図表 33:中小企業業況判断DIの各モデルによる推計

Page 52: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

50

<自動計算システムの開発と課題>

ここまでの分析より、計算やデータの保存処理に掛かる計算コストはそれほど高くは無く、日

次は勿論、リアルタイムでの処理も可能であることを確認した。

構築したモデルとより低コストなデータソースである Streaming APIを用いて、実際に日次で

指数を算出した結果を参考に、指標の算出に係る課題について考察する。

まず、Streaming APIでは、過去時系列データが取得できないことが、運用やモデルの改善に

於いて大きな弊害となると想定される。

特にデータ収集についてはサーバの停止等にも備える必要があるため、同様の収集システム

を複数稼働させる等の対応も必須で、コストも膨らむと考えられる。

このような観点から、無料の APIを用いた指標の安定的な公表や商用サービスの提供は困難も

多く、本実証事業で用いたホットリンクの「口コミ@係長」5や NTT データの「なずき」といっ

た商用サービスの利用や併用も検討すべきと考えられる。

また、単一ないし少数のデータソースを用いた場合、そのデータソースが何らかの原因で利用

できなくなるリスクもあり、リアルタイム性を損なわない範囲で、多様なデータソースを用いる

のが望ましいと考えられる。

その候補としては、前述の複数のブログデータや市場データが挙げられ、さらにニュースや経

済レポート、POSデータといった、経済事象を表す様々なデータが考えられる。

さらに、本事業ではデータの制約や検証期間の短さから実施出来なかったが、インサンプルの

推計(過去データへのフィッティング)で良い精度が出たとしても、アウトサンプルで不安定と

いうことも考えられるため、今後、短くとも数ヵ月の検証期間を設け、アウトサンプルでの検証

を行っていく必要があると考えられる。

5ソーシャル・ビッグデータ分析ツール(https://www.hottolink.co.jp/service/kakaricho)

Page 53: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

51

【総括】

A.既存の経済統計指標を代替・補完する新指標の開発・評価

SNSデータのみを用いたモデルでは、高い精度の推計はできていない。

精度を向上させるため、引続きマルチファクターのモデルの検討を進める。

各モデルの定性評価・検証を行う。

B.地域の経済活動を表す指標算出のための新手法の研究・開発

Twitter データから、高い精度で景気に関するツイートを抽出し、(景気ウォッチャー調

査と同様の)センチメントを判定するAIの開発は完了。

本事業では、地域別に集計する手法の開発には至らなかった。

一部地域に関しては、景気ウォッチャー調査よりも更に詳細な地域別の景況感指標を算

出できる可能性があり、今後の課題とする。

C.中小企業における景況感を表す指標の研究・開発

高い精度の推計を可能とするモデルの開発は完了。

月次、週次、日次で算出することも可能であり、従来と比較して速報性の高い中小企業

景況感の指標として用いることが可能と期待される。

D.指標の安定的な公表に向けたプロトタイプの開発

Streaming APIから取得した Twitterデータについて、データ量としては活用可能なレ

ベルにあるものの、特定期間のデータ欠落などの課題があることが判明した。

指標の精度、安定性の向上のためには、複数のデータソースを組合せることが有効であ

る。

Page 54: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

52

④ NTTデータ/流通経済研究所 実証事業報告(概要)

本事業では、政府統計等のオープンデータ、商品販売データ(家電量販店の販売データ)、SN

Sデータ(ブログ、Twitter)を組み合わせて経済産業指標を開発するため、参加者を募り、コン

テスト形式で指標の開発を競う方法を採用した。

【コンテスト概要】

<開発する指標の種類>

<指標開発に使用するデータ>

コンテスト参加者が指標を開発するために使用できるデータは、政府統計等、家電量販店販売

データ、SNSデータ(ブログデータ、Twitterデータ)である。

なお、参加者は、政府統計等、家電量販店販売データ、SNSデータ(ブログデータ、Twitter

データ)のうち、2種類以上を組み合わせて指標を開発することを条件とした。

<解析環境>

各種の機密データをセキュアに取り扱うために、外部ネットワークから遮断された解析環境を

構築し、解析環境内に機密データを配置して、参加者に提供した。

解析環境は、参加者以外からのアクセス、及び、外部へのデータ持出しができないように対策

を実施した。

Page 55: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

53

また、解析環境が外部ネットワークから遮断されているため、事務局がアプリケーションのイ

ンストール等の操作の代行、あるいは、データの持ち出し申請に対する審査と対応を実施した。

<コンテストの実施ステップ>

イ.各種データをセキュアに取り扱うことが可能な環境の整備

ロ.コンテスト参加者の募集、説明会開催、参加にあたっての誓約書の取り交わし

参加者の募集(WEBサイトの公開、告知等)

一次審査の実施(書面による企画内容等の審査)

説明会の開催(一次審査通過者向け)

誓約書の取り交わし(データの取扱等に関する誓約書)

ハ.データ解析の実施、解析結果の評価、報告会の実施

解析環境およびデータの貸与(データの解析、指標開発)

中間報告レポートの提出

最終報告用資料の提出

最終報告会の実施(最終審査)

<コンテストの実施期間>

参加募集期間:2016年11月 2日~2016年12月4日(約1か月間)

一次審査 :2016年12月 5日

指標開発期間:2016年12月 7日~2017年 2月20日(約2.5か月間)

最終審査 :2017年 2月22日

図表 34:WEBサイトのアクセス状況等

Page 56: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

54

【コンテスト最終結果】

コンテストの本申込(企画提案書の提出)は、15件あり、うち10件が一次審査を通過した。

一次審査通過者のうち9件が最終審査に参加し、最終審査において、3件が優秀賞に、2件が

若手研究奨励賞に選定された。

コンテスト参加者ごとの最終結果、所属組織、選択した指標種別、使用データ等は以下のとお

りである。

図表 35:コンテスト参加者別結果一覧

ブログ Twitter

参加者1 A大学 1.Forcasting ○ ○ ○

参加者2 B大学院 3.新指標 ○ ○ ○

参加者3 C大学 3.新指標 ○ ○ ○ ○

参加者4 民間企業1 3.新指標 ○ ○

参加者5 D大学院 3.新指標 ○ ○ ○ ○

参加者6 民間企業2 3.新指標 ○ ○ ○

参加者7 民間企業2 2.Nowcasting ○ ○ ○

参加者8 E大学 2.Nowcasting ○ ○

参加者9 民間企業3 3.新指標 ○ ○ ○

参加者10 F大学 3.新指標 ○ ○

参加者11 民間企業1 2.Nowcasting ○ ○ ○ ○

参加者12 G大学 2.Nowcasting ○ ○ ○

参加者13 H大学 3.新指標 ○ ○ ○ ○

参加者14 民間企業4 3.新指標 ○ ○ ○

参加者15 民間企業5 2.Nowcasting ○ ○ ○ ○

一次審査通過

若手研究奨励賞

優秀賞

SNS結果 代表者名 所属組織名 指標種別

政府

統計等

家電

販売

以下、コンテストにて優秀賞または若手研究奨励賞を受賞した参加者の企画提案内容における

目的、問題意識を掲載する(チーム代表者の括弧内の記載は主たる実施者の所属等)。

<優秀賞1:参加者1>

チーム代表者 大学准教授

目的 ・Forecasting指標(将来予測)

Twitterを利用した既婚女性に対する非労働力人口の予測モデル構築

問題意識 少子高齢化社会において労働人口を維持するには非労働力人口を労働力

人口に変える必要がある。結婚・出産による女性の離職率は高く、その

時期の離職率を下げることが重要である。

Page 57: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

55

<優秀賞2:参加者2>

チーム代表者 大学教授(大学院博士課程)

目的 ・新指標

社会ムードから一週間先の購買力を予測する指標の開発

問題意識 近年はSNSによって形成される社会ムードの経済への影響が大きくな

ってきている。SNSの投稿には購買後のレビューに加え、購買にまで

は至らなかった消費者の声といった情報も含まれており、多くの情報を

持ったデータといえる。既存の消費者行動に関する経済指標は、実際に

購買行動を起こした消費者データのみを用いており、社会ムードを反映

した指標は存在しない。

<優秀賞3:参加者3>

チーム代表者 大学講師

目的 ・新指標

新しい地域指標である「地域活性度」の定義と活用を議論する。

また、POSデータ活用の可能性と限界を議論する。

問題意識 主に大企業や大規模事業のサンプリングデータから推定された住宅/設

備投資とGDPなど経済指標統計は、中小企業の売上/事業所数の比率

が大きい地方の経済実態との乖離が大きい傾向がある。また、地域経済

の因果を的確に把握することは、国家のGDPの各構成要素の精度向上

につながる。他方で、地域の経済や特性を測る総合指標や相対評価に欠

き、地方行政など事業の目標の妥当性が課題である。

<若手研究奨励賞1:参加者4>

チーム代表者 民間企業データアナリスト

目的 ・新指標

産業間および産業内の労働力移動をブログ等のデータから定量化した

指標の開発

問題意識 キャリアパスの選択肢を把握したい個々の労働者からも、優秀な人材を

獲得したい企業からも、労働力から産業構造を把握したい政府からも、

産業間/内の労働力移動を可視化する有益な指標が望まれていると考え

られる。

Page 58: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

56

<若手研究奨励賞2:参加者5>

チーム代表者 大学准教授(大学院修士課程)

目的 ・新指標

消費者の潜在意識を考慮した客観的な重み付けに基づく経済指標の開

問題意識 既存の経済産業指標は、統計調査をもとに厳格な手順で作成されており、

信頼のおけるものであるが、月次で作成される指標が多く、消費者の短

期的な動向を捉えきれないという欠点がある。変化の激しい現代におい

て、既存の経済産業指標では考慮されていない消費者の潜在意識などを

考慮することが重要だと考えられる。

【総括】

<コンテスト実施により得られた成果>

学術界、産業界からの参加者により、オープンデータとビッグデータを組み合わせた研究

が推進された。これは、通常は入手することが容易ではない販売データや SNS データを、

事務局が参加者に貸与するという方法を採用したことで得られた成果である。

参加者にとって、最終報告会における審査員からの質問やコメントは、示唆に富んだもの

が多かったと思われる。また、研究者、実務家間での交流、データ提供企業との情報共有

など、様々な分析視点に触れ、研究を更に発展させるきっかけとなる貴重な場といえる。

各参加者が開発した新しい経済産業指標に関するアイデアそのもの、すなわち、指標の意

義、指標の定義、算出方法なども成果として挙げられる。

新しい経済産業指標を開発する際の問題意識や、既存の経済産業指標が有す問題点といっ

た事項も、コンテストの実施を通じて得られた成果だといえる。

<コンテスト実施にかかる課題>

コンテストの実施時期(12月から翌年2月)について、解析のための時間を確保するこ

とが難しいということ、また、解析期間が約2ヶ月間というのが短過ぎるということで、

コンテストの参加を見送るケースが多く見られた。

普段使用している解析環境が使えないことで、参加を躊躇するケースも多く見られた。ま

た、コンテスト開始後の解析環境へのデータの持ち込みやインストールについて、参加者

の要望が集中する時期など、事務局側が適時に対応できていない状況にあった。

コンテスト申し込み時点で、使用するデータの詳細が調整できておらず、コンテスト申込

者に通知出来ていなかったため、短い募集期間における企画案の作成に支障をきたした恐

れがあった。

Page 59: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

57

<改善方針案>

コンテスト参加者を増やすため、実施時期を見直すこと(年末年始や年度末を避ける)、分

析期間を延長することが有効だと考えられる。

参加者数を増やすため、かつ、参加者が普段の実力を十分に発揮できるよう、参加者の利

便性を満たす解析環境で作業できるようにすることが必要である。

一方で、参加者のローカル環境に提供できないレベルの機密データを扱う場合は、上記の

ような参加者の要望を把握していたとしても、対応することは難しいため、データ提供企

業から貸与していただくデータの範囲や粒度等をある程度限定的にすることで、データの

機密性を下げることが挙げられる。

事務局側の対応姿勢として、参加者からの要望に都度対応するのではなく、予め要望や依

頼事項の内容、実施時期を予測しておき、作業の集中を避けるためにも、事務局側から働

きかける姿勢が必要である。

申し込みの時点で参加者の不安を解消しておくことも重要である。事前に説明会を開き、

コンテストの概要や使用データ、解析環境などについて情報を伝えることで、参加しやす

くなると考えられる。

Page 60: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

58

第3章 ビッグデータの利活用に関する有識者委員会

1.有識者委員会

本事業におけるビッグデータの利活用に関する有識者委員会(有識者委員会)には、以下のと

おり9名の委員及び1名の審議協力者に参画頂いた。(五十音順、敬称略)

【委員】

氏名 所属 役職 備考

小西 葉子 経済産業研究所 上席研究員 ・実証事業評価担当 ・WG1座長

小巻 泰之 日本大学 教授

斎藤 太郎 ニッセイ基礎研究所 経済調査室長

佐藤 忠彦 筑波大学 教授 ・実証事業評価担当 ・WG2メンバー

西山 智章 流通システム開発センター 理事 ・WG2メンバー

羽鳥 健太郎 情報処理推進機構 調査役 ・実証事業評価担当 ・WG2メンバー

元橋 一之 東京大学 教授 ・有識者委員会座長

本村 陽一 産業技術総合研究所 人工知能研究センター

首席研究員 ・実証事業評価担当 ・WG2座長

渡辺 努 東京大学 教授

【審議協力者】

氏名 所属 役職 備考

西郷 浩 早稲田大学 教授 ・審議協力者

また、オブザーバーとして参画頂いた関係府省ならびに関係団体は以下のとおり。

【オブザーバー(関係省庁等)】

内閣府 政策統括官(経済財政分析担当)付参事官(総括担当)付

内閣府 経済社会総合研究所国民経済計算部企画調査課

Page 61: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

59

総務省 大臣官房企画課政策室(総務大臣補佐官室)

総務省 統計局統計調査部調査企画課

総務省 政策統括官(統計基準担当)付統計審査官室

日本銀行 調査統計局

【オブザーバー(関係団体)】

大手家電流通協会

日本百貨店協会

日本フランチャイズチェーン協会

日本チェーンストア協会

日本スーパーマーケット協会

日本ドゥ・イット・ユアセルフ協会

日本チェーンドラッグストア協会

【開催実績】

有識者委員会は以下のとおり計3回開催した。

・第1回 有識者委員会

日時:2016年11月7日(月曜日)10時00分~12時00分

場所:経済産業省 別館 1階 104各省庁共用会議室

・第2回 有識者委員会

日時:2017年 2月 2日(木曜日)9時30分~12時00分

場所:経済産業省 別館 1階 114各省庁共用会議室

・第3回 有識者委員会

日時:2017年 3月15日(水曜日)17時30分~19時30分

場所:経済産業省 別館 1階 114各省庁共用会議室

【検討・討議内容の概要】

有識者委員会においては、実証事業、ワーキンググループ、包括的調査に係る進捗や成果の報

告等を受け、それらの内容について助言等を行うとともに、経済産業統計の一層の向上に向けた

ビッグデータ活用の提言(案)の取りまとめに向けた検討、討議を行った。

論点ごとの主な検討、討議内容は以下のとおり。

<データの網羅性>

何を全体とするのかにより、カバー率の数字は意味が違ってくる。商業動態統計に関しては

種々の制約があり、調査対象等にも限界があると思われるが、POSデータは、導入済みの

Page 62: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

60

社には既に存在しており、それを活用することによって、より精度の高い議論ができる可能

性がある。

網羅性について、何を以て100%とするかという議論もあるが、それを踏まえたうえで、

真実はどこにあるのかをどう考えるかが重要である。

カバー率は重要とは思うが悉皆調査のような形式はこの手のデータの場合そもそも難しいと

思われる。よって店舗間の異質性を前提にして議論を展開すべきではないか。

<複数種別のデータの組合せ>

ビックデータの活用を考える際、ある程度詳細なデータが二次利用可能になると、これとさ

らに別のデータを組合せた分析が今後新しくできるという点は非常に画期的なのではないか。

これまでのオープンデータの利用を踏まえると、オープンデータだけでは全然価値が出てこ

ないため、クローズドデータといかに組み合わせて価値を上げるかということが重要である。

ローデータの公開は難しくとも、結果として出てくる統計情報のような形であれば公開が可

能というケースもあるのではないか。

<既存統計と比べた際のメリット>

商業動態統計の迅速化については、商業の動態を見るにも関わらず、対象月の速報の公開は

翌月の中旬から下旬、確報になると翌々月の中旬頃となっており、約一か月半かかっている

のが現状である。適時の判断を可能とする観点からは、約一か月半後に確報が出るというの

は改善の余地があると思われる。他の動態系の調査も同様である。

商業動態統計の詳細化については、実態を正確に捉えてないという観点よりも、より細かく

もう一歩踏み込んだ商品分類、地域分類を提供できればより的確な判断ができるのではない

かと考えられる。

POSデータには商業動態統計に含まれていない価格と数量の両方のデータが含まれる。例

えば、販売額が伸びている場合に、価格が騰貴しているのか、数量が伸びているのか、何れ

がどの程度貢献しているかなど、価格の面と数量の面、両方から分析することができるよう

になるのではないか。

<ビッグデータを活用した新指標の位置づけについて>

サンプルバイアスについて、仮に悉皆調査に近かったとしても、全ての領域で同様のカバレ

ッジが期待できるわけではない。そうするとどういうデータが手元にあり、それが母集団か

らどの程度変わっているのかを評価することが必要になる。サンプルバイアスをどうやって

最小化するか、どう評価するかが非常に重要である。

エラーが出たときの対処について、最終的な成果物、統計を公表するのは引き続き経産省で

あるとした場合、様々な政府統計について責任を持っているのと同様に責任を持つことが可

能なのか。現状は経産省が作成プロセスをコントロールしており、何かミスがあったときも

Page 63: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

61

事後処理が出来る状況にある。それと同じような管理ができるかというのが非常に大事なポ

イントではないか。

データフローの中でもチェック体制をどのように構築していくか、純粋なデータのエラーも

さることながら、意図的な誤差もありうる。国の機関が何かの数字を作るとなれば大きなイ

ンパクトを持ち、その利害に絡んでその数字を意図的に動かすような状況も場合によっては

ありえると思われるが、それをどうやって防ぐか、あるいは大丈夫だと示すにはどうしたら

いいのかも、当初の段階で考えるべき大事な問題ではないか。

複数の数字が特定の目的のものについて出てくる可能性についても留意する必要がある。商

業の売り上げという抽象的なものについて、現行の商業動態統計とビッグデータを利活用し

た指標が公開されると、数字が異なる可能性もあり、利用者の観点からは、複数指標あると

いうことは様々な解釈が可能になり、利用者が混乱しないような体制を現段階から少しずつ

でも考えていく必要がある。

現状のデータの収集方法に比べて、ビックデータで集めた場合これだけのコストが削減可能

ということがないと切り替える意味が少なくなるのではないか。

<今後の検討課題等>

POSデータの収集から集計までにおいて、マスター情報の整備という問題が必ず出てこよ

う。今回の対象である家電量販店であれば製造業者もかなり限られているため、周辺情報の

整備が比較的簡単にできると思われるが、スーパーやコンビニなどで扱っている食品や日用

品などでは状況が大きく異なっており、既存のJANコードデータベースなども用いつつ、

関連の情報をどう整備していくかということを検討していく必要があると思われる。

個人情報の問題として、Twitter などオープンになっていて、それ自体個人情報ではないが、

ある程度集約すると個人情報と定義され、流通させられなくなることがありうる。官庁の中

であれば問題はないのか、集計されておりその物自体を出すというわけではないから問題な

いのか、その辺りは留意した方がいいと思われる。

意図的な数字の操作についても、市況、いわゆる市場での効果を勘案すると、かなりセキュ

リティ面での検討をする必要はあると思われる。

<POSデータを活用した経済産業統計の改善の目的について>

本来の目的は商品に対するトレンドを示す指標を作るということである。商業動態統計には

諸々の制約条件があることも考慮すると、商業動態統計に近づけていくことも目的の一つで

はあるが、それだけでは十分ではない。

商品マスターについては、政府統計という位置づけからすると、本来的には政府が持つべき

である。民間企業が保有しているものをそのまま利用することは考えにくいのではないか。

POSデータを活用することで、どの程度の精度、速さが実現できるのか、より詳細に検討

出来ると良い。加えて、現状の商動でカバーできず、その他という区分でまとめてしまって

Page 64: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

62

いるものをより細分化出来るなど、価格の変動だけではなく、量の変動も指標に使えるかも

しれない。

POSデータは商動(商業動態統計)よりはむしろ生動(生産動態統計調査)に近いと思わ

れる。現状の商動では、その他の区分に少なからず計上されてしまうため、品目を決めてか

らそのデータを収集するという考え方に変えることも検討した方がよい。

<POSデータ活用に際しての留意点等>

POSデータを活用する際には、分散の情報をどう使うかが重要になってくると思われる。

店舗ごとに、価格設定も品ぞろえも違う状況で収集されたデータについて、平均をとってし

まうとミスリードするような結果になる可能性もある。店舗や地域の違い、トレンドなどを

含め、商品カテゴリー・商品間の違いなどをうまく使う統計を考えていく必要がある。

マスター自体を整備するということが現在大きな問題になっており、技術的に代替可能なも

のと不可能なものとの切り分けを明確にしていく必要がある。

POSデータにはクレンジングが必要となるなど様々なエラー要因があるが、それは既存の

政府統計など種々の制約からどうしても見えない部分、各店舗や企業ごとの差異など、言わ

ば既存統計に関する問題点についての参考にもなるのではないか。

今までの商業動態統計とは全く違う、インターネットが普及している社会環境の中だからこ

そできる新しい指標の取り方、速報性も高く、人手も省けるものを提示できると良い。正確

性を突き詰めると時間がかかるため、速報性が高く一定程度不確かなもの、または時間はか

かるが正確性が高いものなど、利用者が選択できることが望ましい。

Page 65: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

63

2.ワーキンググループ(WG)

(1)規制・ルール整備検討WG

【開催実績】

規制・ルール整備検討WGは以下のとおり計3回開催し、ビッグデータ活用に必要となる規制・

ルール整備内容、ビッグデータの統計作成業務への利活用並びにその効果等について討議を行っ

た。

・第1回 規制・ルール整備検討WG

開催日:2017年1月26日(木曜日)

・第2回 規制・ルール整備検討WG

開催日:2017年3月8日(水曜日)

【検討結果】

第1回有識者委員会で提示された「WG1検討テーマ」について検討した結果は以下のとおり。

なお、検討方法については、「ビッグデータ収集方法(参考1)」との関係を整理した「論点(参

考2)」に基づき検討を行った。

また、統計法上の解釈については最終的に総務省の確認を要する。

1.ビッグデータの統計作成業務への利活用並びにその効果検討

(1)ビッグデータを活用した統計の位置付けはどうあるべきか

→現行制度上の課題はないのではないか。

A-1,A-2,Bともに「統計調査」に該当し、現行制度上の差異はない。

Cは「統計調査」との位置づけにはならない。

(2)ビッグデータを活用した統計の迅速化・詳細化はどこまで進めるべきか

→可能な限り迅速化・詳細化に努めるべき。

→迅速化・詳細化について、現行制度上の課題はないのでなないか。

ただし、「基幹統計」を代替する場合は、変更部分に係る総務大臣の事前承認及び実施規則

の改正等、「一般統計」の場合は、総務大臣の事前承認等の手続が必要。

(3)データ報告者の負担の所在及び提供のインセンティブのあり方

→受領した「調査票情報」には守秘義務が発生し、A-2の代理提出機関がそのまま「自社

ビジネス」に利用することは出来ない。

Page 66: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

64

→代理提出事業者には作成資格や認定制度等を検討する必要がある。

2.ビッグデータ活用に必要となる規制・ルール整備内容の検討

(1)ビッグデータを活用して政府統計を作成する際の現行制度上の課題

→各テーマと密接に関係するため、各テーマの検討に内包(省略)

(2)収集データの粒度と表章(公表)の粒度について

→現行制度上の課題はないのではないか。

データ収集と表章(公表)の粒度が異なる点について、総務大臣の事前承認を得ることで、

現行制度上の課題はないのではないか。

(3)二次利用申請があった場合には、個票データとしてどこまで開示提供すべきか

→現行制度上の課題はないのではないか。

A-1、A-2で提出される「編集・加工済みビッグデータ」は、「調査票情報(調査票の

様式に準じる様式)」であり、現行制度上と差異はないため、「二次利用」の対象となる。

一方、Bで提出される「ビッグデータ」は、「調査票情報(調査票の様式に準じる様式)」

ではなく、調査対象が「任意で提出したもの」と「統計調査の代替として報告を求められ

ているもの」が混在した情報と想定されるので、「二次利用」の対象とならないのではない

か。

【今後の検討課題】

1.今回、A-1、A-2、B、Cの4パターンを前提に検討したが、これ以外のスキームの有

無について再度検討する。

2.各調査客体(データホルダー)等の置かれている状況等を踏まえた最適なパターン又はパタ

ーンの組み合わせを検討し、必要となる規制・ルールの改正や対応等を検討する。

Page 67: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

65

参考1:「ビッグデータ収集方法」

参考2:「論点整理の結果」

Page 68: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

66

(2)マスター・システム整備検討WG

【開催実績】

マスター・システム整備検討WGは以下のとおり計4回開催し、政府統計用品目マスター管理

手法、システムのあり方等について討議を行った。

・第1回 マスター・システム整備検討WG

開催日:2016年12月13日(火曜日)

・第2回 マスター・システム整備検討WG

開催日:2017年1月19日(木曜日)

・第3回 マスター・システム整備検討WG

開催日:2017年3月8日(水曜日)

【検討結果】

第1回有識者委員会で提示された「WG2検討テーマ」に基づき論点整理を実施、第2回有識

者委員会において報告したとおり「WG2論点(参考1)」をベースに検討を行った。検討結果は

以下のとおり。

1.マスターの観点

論点1:政府統計用品目マスターの保有すべき情報

POSデータの活用を考える場合、個別の商品が識別できる、JANコードレベルでの取

扱を考慮することが適切である。

小売事業者、POS収集事業者各社においては、既にJANコードレベルの商品群を自社

独自の分類に振り分けており、統計用のマスターとしては、これらを統合化し、統計調査

の報告項目と対応させたものが一つの完成形として想定される。

報告項目は固定化を前提とすべきではなく、時勢に合わせて集計対象を適時に更新できる

ような体制とし、かつ、継続性維持の為、過年度の集計を再現できるように更新の履歴を

保持することが望ましい。

※商業動態統計:家電大型専門店用品目マスターイメージ(参考2)

論点2:マスターの維持・提供に係る民間との連携のあり方

政府単体で、JANコードレベルから統計調査の報告項目までの全ての紐付けを網羅した

マスターを整備することは、作業負荷の点で非現実的であり、既に民間事業者が何らか分

Page 69: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

67

類をしていることを勘案すると、効率性の観点からも望ましくない。

民間事業者(POS収集事業者や大手小売事業者等)に蓄積されているマスター情報やマ

スター維持のノウハウ活用を念頭に、政府の統計用マスターを構築・維持することで民間

事業者が得られるメリットを織り込んだインセンティブ設計を行ったうえで、民間との連

携のあり方を検討すべきである。

2.システムの観点

論点3:取扱う情報に応じた収集・集計・匿名化等処理の自動化のあり方

取扱いデータの増大を踏まえると、現在人手を介して行っている収集(督促等含む)・集計・

匿名化(秘匿)等処理がボトルネックになり、ビッグデータ活用の利点の一つである迅速

性が損なわれる(情報の鮮度が低下する)懸念がある。

調査対象から報告を受けた後の各工程の自動化の検討を、新たな IT技術ならびに統計処理

(匿名化手法等)の活用を前提に進めるべきである。

論点4:システムの維持・運用に係る民間との連携・分担のあり方

報告項目の詳細化、報告の高頻度化により、日次・週次レベルでデータ処理量が大幅に増

減することも想定されるため、柔軟にデータ処理容量の変更が可能な、効率的な ITシステ

ムが必要となる。

民間事業者(POS収集事業者や ITサービス提供事業者)に蓄積されている運用ノウハウ

等の活用も念頭におきつつ、政府統計として具備すべき可用性、信頼性、セキュリティ等

の要件充足を条件とした民間との連携のあり方を検討すべきである。

3.フォーマットの観点

論点5:フォーマットの仕様(データ項目・インターフェイス形式)のあり方

集計・秘匿処理等の自動化(論点3)も勘案しつつ、かつ報告者に過剰な負担を強いない

よう考慮した、フォーマットの仕様を検討すべきである。

ビッグデータ活用(の利点)が、業態間またはデータ報告フローにおける事業者間のセク

ショナリズム(仕様や機能の縦割り)によって阻害されることがないよう、共通基盤とし

て機能するフォーマットのあり方を検討すべきである。

4.マスター・システム共通の観点

論点6:マスター・システムの構築、改修プロセスのあり方

業態により、POS収集事業者や小売事業者等の状況は大きく異なる(例:家電量販店は

GfKジャパンが9割程度のPOSデータを収集済み、コンビニエンスストアは大手 3チェ

ーンで販売額の9割程度を占める、等)。

各業態の状況ならびに業態内での競合関係等も勘案した、中立性・独立性の高い機関の仲

Page 70: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

68

介等も選択肢として検討し、最終的な民間事業者との連携のあり方を見定めたうえで、マ

スター・システムの構築、改修プロセスを検討すべきである。

【今後の検討課題】

1.マスターの観点

既存統計の商品分類(例:商業動態統計の内容例示に示されている項目(テレビ・プロジェ

クタ、等))について、詳細な定義が明示されていないものがあり、報告項目詳細化に際して、

分類の判断が定まらない可能性があるため、マスターの構築にあたっては、これらの詳細な

定義を全て明らかにする必要がある。統計用のマスター構築・維持による、民間事業者のイ

ンセンティブ設計を行うためにも、ビッグデータの活用によって社会全般にもたらされるメ

リット、各民間事業者が享受できる利点(何を利点と考えるかを含む)を明らかにする必要

がある。

2.システムの観点

政府統計調査の報告を受け、統計情報を公開するまでの一連のシステムに求められる、セキ

ュリティ、可用性、信頼性等の要件について整理、検討を行い、コスト負担に十分配慮した

システム構築のプロセス、システム運用における民間事業者との連携パターンを明らかにす

る必要がある。

データの授受、受領後の集計・秘匿等処理の自動化ならびにAI技術などの積極的な活用を

推進するための要件を満たし、報告者負担に十分配慮したフォーマット(データ項目、イン

ターフェース形式等)を明らかにする必要がある。

ビッグデータ活用の利点を最大化するためにも、業態横断的な、また小売事業者とPOS収

集事業者間を跨ぐ、共通的なデータ流通の基盤として求められる要件を検討し、明らかにし

ていく必要がある。

Page 71: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

69

参考1:「WG2論点」

参考2:「商業動態統計:家電大型専門店用品目マスターイメージ」

Page 72: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

70

3.経済産業統計の一層の向上に向けたビッグデータ活用の提言(案)取りまとめ

有識者委員会において、実証事業の実施計画ならびに実施結果の報告、ワーキンググループで

の検討内容ならびに検討結果の報告、包括的調査結果の報告等を受け、討議を行い、別添資料1

のとおり、経済産業統計の一層の向上に向けたビッグデータ活用の提言(案)を取りまとめた。

Page 73: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

71

第4章 新指標へのビッグデータ活用に向けた包括的調査

1.国内調査

2016年6月に閣議決定された「経済財政運営と改革の基本方針 2016(骨太方針 2016)」にお

いて、「経済統計の改善」として、

① 総務省は、統計委員会が取りまとめた取組方針に基づき、関係府省庁の協力を得て、統計の精

度向上に取り組むこと

② 経済財政諮問会議において、統計委員会と連携しつつ、「行政記録情報やビッグデータなどの

新たなデータ源についての効率的な活用の推進」等、政府の取組方針を年内に取りまとめること

等が明記されている。

【骨太方針 2016該当箇所抜粋】

第2章 成長と分配の好循環の実現

2.成長戦略の加速等

(7)経済統計の改善

経済財政運営に当たっては、不断の統計の改善が必要である。

総務省は、統計委員会が取りまとめた取組方針に基づき、関係府省庁の協力を得て、統計の

精度向上に取り組む。

景気判断をより正確に行う観点から、行政記録情報やビッグデータ等の活用を拡大する。さ

らに、GDP統計をはじめとした各種統計の改善に向け、経済財政諮問会議において、統計委

員会と連携しつつ、以下の課題を含む政府の取組方針を年内に取りまとめる。

① 経済社会構造の変化を横断的に正確に反映する仕組み

② 類似統計間の統計手法、結果等についての比較分析と、統計改善に向けたフィードバッ

クの仕組み

③ 利用者視点に立った府省庁横断的な地域区分の統一の推進などの統計比較可能性の強化

④ 行政記録情報やビッグデータなどの新たなデータ源についての効率的な利活用の推進

また、同年12月21日には経済財政諮問会議において、新たなデータ源の活用の推進につき、

「統計改革の基本方針」の中の一つとして以下が決定された。

・ビッグデータを活用した経済指標等の開発に当たっては、景気動向把握の向上に資するよう考

慮するとともに、既存統計では把握できない経済活動の把握に努める。 (関係府省)

・ビッグデータを用いた新たな景気動向のための指標として、POSデータをきめ細かく分析に

Page 74: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

72

利用する手法の開発に向けた検討を行う。

また、物流データを活用した地域間の移出入の動向把握に向けて、調査機関と連携して研究を

進める。 (内閣府)

これを受け、関係府省において、早期かつ精緻な景気動向把握に資するビッグデータの活用の

促進やビッグデータ活用に関する環境・体制整備等の課題への取組が本格的に始まったところで

ある。

他府省における具体的な取組としては、以下のような取組が挙げられる。

① 総務省 速報性のある包括的な消費関連指標の在り方に関する研究会

【目的】

総務省では、我が国の家計収支の実態を明らかにするため、毎月、全国の世帯を対象に家計調

査を行っており、その結果は、経済動向の分析、税制や社会保障政策の検討、消費者物価指数の

作成、地域振興など幅広く利活用されています。

他方で、高い精度を持つ景気指標として利用するためには、標本調査としての限界もあり、家

計調査の補完・補強や、ビッグデータ等を用いた指標開発など、新しい視点による消費関連統計

の整備が急務となっています。

このため、総務省では、総務大臣の主宰による「速報性のある包括的な消費関連指標の在り方

に関する研究会」を新たに開催し、消費全般の動向をマクロ、ミクロの両面で捉える指標の開発

に向け、その在り方について検討を進めてまいります。

【構成員】

飯塚信夫 神奈川大学経済学部教授

岩村有広 一般社団法人日本経済団体連合会経済政策本部長

小塩隆士 一橋大学経済研究所教授

久我尚子 株式会社ニッセイ基礎研究所主任研究員

国友直人 明治大学政治経済学部特任教授 ※座長

熊谷亮丸 株式会社大和総研調査本部副本部長・チーフエコノミスト

河野康子 一般社団法人全国消費者団体連絡会事務局長

新家義貴 株式会社第一生命経済研究所主席エコノミスト

末澤豪謙 SMBC日興証券株式会社金融財政アナリスト

菅 幹雄 法政大学経済学部教授

関口博之 日本放送協会解説主幹

Page 75: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

73

永井暁子 日本女子大学人間社会学部准教授

平嶋彰英 総務省参与

美添泰人 青山学院大学経営学部プロジェクト教授 ※座長代理

渡辺 努 東京大学大学院経済学研究科教授

※ このほか、関係省庁等もオブザーバーとして参加

【検討事項】

1 新指標の作成方法、体系化の在り方

2 単身モニター調査、パネルデータ、供給側データ、ビッグデータの変動分析、

バイアス補正及び合算方法

3 家計調査、家計消費状況調査の推計及び合算方法、公表の一体化 等

【開催状況】

第1回:平成28年 9月15日

第2回:平成28年10月14日

第3回:平成28年11月16日

第4回:平成28年12月27日

第5回:平成29年 2月21日

第6回:平成29年 3月22日

平成29年3月22日「速報性のある包括的な消費関連指標の在り方に関する研究会」報告書

「消費動向指数(CTI)の開発に向けて」を公表。

② 総務省 統計委員会 横断的課題検討部会

【委員】

西村淸彦 東京大学大学院経済学研究科教授 ※部会長

北村行伸 一橋大学経済研究所教授

河井啓希 慶應義塾大学経済学部教授

川﨑 茂 日本大学経済学部教授

清原慶子 三鷹市長

西郷 浩 早稲田大学政治経済学術院教授

嶋﨑尚子 早稲田大学文学学術院教授

白波瀬佐和子 東京大学大学院人文社会系研究科教授

Page 76: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

74

関根敏隆 日本銀行調査統計局長

永瀬伸子 お茶の水女子大学基幹研究院人間科学系教授

中村洋一 法政大学理工学部教授

野呂順一 株式会社ニッセイ基礎研究所代表取締役社長

宮川 努 学習院大学経済学部教授

【検討事項】

横断的課題検討部会において平成 28年度後半に審議する事項について(案)

(平成28年10月11日)

1 統計の精度向上及び推計方法改善WGでの取組

統計委員会報告に記載された精度向上の取組を本格稼動させるため、総務省が計画的に行う統

計精度に関する定期的な検査に関する検査計画、検査事項、検査基準その他の必要な事項を具

体化する。

2 ビッグデータの活用に向けた取組

行政機関におけるビッグデータの研究や活用の状況、民間におけるビッグデータの保有状況や

活用の状況について報告を受け、今後の活用に向けた情報の共有を図るとともにバイアスの補

正、民間で行われる活動との関係の議論に着手する。

3 学術・民間データの活用

統計法第33条に基づき提供された調査票情報を用いて行なわれた研究成果等を把握し、それ

を国、自治体等で利用できる方法を検討する。

4 多様化するサービス産業の計測

本年度、シェアエコノミーの出現など複雑・多様化するサービス産業の活動を計測の在り方に

ついて統計委員会担当室において調査研究を行うこととしており、その中間報告を部会に行っ

て意見交換を実施する。

【開催状況】

第1回:平成28年 5月20日 ※参考:平成28年度前半

第2回:平成28年 9月23日 ※参考:平成28年度前半

第3回:平成28年 9月29日 ※参考:平成28年度前半

第4回:平成28年10月11日

第5回:平成28年11月18日

第6回:平成28年12月16日

第7回:平成29年 1月27日

第8回:平成29年 2月23日

第9回:平成29年 3月21日 ※ビッグデータの活用に向けた各府省の取組として、経済

産業省より本事業について報告

Page 77: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

75

③ 総務省 統計局 家計調査の改善に関するタスクフォース

【目的】

家計調査は、我が国の家計収支の実態を明らかにするための統計調査であり、その結果は、景

気動向の判断、税制や社会保障政策の検討、消費者物価指数の作成、地域振興など幅広く利用さ

れています。

一方、家計調査に対しては、調査世帯が偏っているのではないか、調査結果の振れが大きくな

ることがあるのではないかといった各種の指摘も見られます。

個人消費の動向への注目が集まる中で、消費の実態をより的確に把握するために、家計調査と

して今後取り組むべき事項などについて検討を行うことを目的として「家計調査の改善に関する

タスクフォース」を開催します。

【構 成 員】

宇南山卓 一橋大学経済研究所附属社会科学統計情報研究センター 准教授

小巻泰之 日本大学経済学部 教授

瀧 俊雄 (株)マネーフォワード 取締役・Fintech 研究所長

宅森昭吉 三井住友アセットマネジメント(株) 理事・チーフエコノミスト

櫨 浩一 (株)ニッセイ基礎研究所 専務理事

森川博之 東京大学先端科学技術研究センター 教授

美添泰人 青山学院大学経営学部 プロジェクト教授 ※座長

※ このほか、関係省庁等もオブザーバーとして参加

【検討事項】

1 正確性の一層の向上

2 社会経済の変化を踏まえた対応

3 家計消費の把握のための新たなアプローチ 等

【開催状況】

第1回:平成28年 6月15日

第2回:平成28年 6月27日

第3回:平成28年 7月12日

第4回:平成28年 7月25日

平成29年7月「家計調査の改善に関するタスクフォース取りまとめ」を公表。

Page 78: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

76

④ 内閣府 より正確な景気判断のための経済統計の改善に関する研究会

【構成員】

伊藤元重 経済財政諮問会議議員、学習院大学国際社会科学部教授 ※座長

小峰隆夫 法政大学大学院政策創造研究科教授

宅森昭吉 三井住友アセットマネジメント株式会社 理事・チーフエコノミスト

中村洋一 法政大学理工学部教授

門間一夫 みずほ総合研究所・エグゼクティブエコノミスト

美添泰人 青山学院大学経営学部プロジェクト教授

渡辺 努 東京大学大学院経済学研究科教授

渡辺美智子 慶應義塾大学大学院健康マネジメント研究科教授

【検討事項】※抜粋

1 経済社会構造の変化の横断的反映

2 類似統計間の比較分析

3 新たなデータ源の活用

・景気動向把握におけるビッグデータ活用の可能性

・景気動向把握における行政記録情報等の活用の可能性

・ビッグデータや行政記録情報の効率的な活用

・ビッグデータや行政記録情報の活用状況の把握とその効率的な利活用に向けた検討

4 その他の検討事項

5 GDP統計の改善

【開催状況】

第1回:平成28年 9月28日

第2回:平成28年10月 6日

第3回:平成28年11月10日

第4回:平成28年12月 5日

第5回:平成28年12月13日

平成28年12月14日「より正確な景気判断のための経済統計の改善に関する研究会 報告」

を公表。

Page 79: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

77

⑤ 内閣府 EBPMのニーズに対応する経済統計の諸課題に関する研究会

【趣旨】

効果的な政策の企画立案の根拠を提供する重要な基盤である経済統計について、施策ユーザー

のニーズから見た諸課題とその原因、改善方策を探るとともに、確かな根拠に基づく政策立案

(EBPM)の定着等について検討を行い、関連行政の改善案について行政改革担当大臣に助言を

行うため、EBPMのニーズに対応する経済統計の諸課題に関する研究会(以下「研究会」という。)

を開催する。

【構成員】

三輪芳郎 内閣府大臣補佐官、大阪学院大学経済学部教授 ※座長

金本良嗣 電力広域的運営推進機関理事長、政策研究大学院大学特別教授 ※座長代理

赤井厚雄 株式会社ナウキャスト取締役会長、早稲田大学研究院客員教授

橋本英樹 東京大学大学院医学系研究科教授

渡辺 努 東京大学大学院経済学研究科教授

【開催状況】

第1回:平成28年10月 7日

第2回:平成28年10月14日

第3回:平成28年10月25日

第4回:平成28年10月28日

第5回:平成28年11月 4日

第2回:平成28年11月18日

第3回:平成28年11月22日

第4回:平成28年11月25日

第5回:平成28年12月 6日

平成28年12月16日「これまでの議論のまとめ」を公表。

Page 80: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

78

2.海外調査

(1)調査先1:国際連合統計部(UNSTATS)

日時:2017年2月16日 7時-8時

場所:PwC 汐留オフィス(住友不動産汐留浜離宮ビル)※遠隔会議

担当:国際連合 経済社会局 統計部

議題:公的統計へのビッグデータ活用の取組

【ヒアリング結果概要】

1. 新たなデータソース

新たなデータとして着目しているのは、mobile phone data, social media, satellite

imagery等である。

2. 民間企業との連携

民間企業の方が進んだ手法を持っており、その経験値を活用する為にも、各国統計機関

はもっと迅速に民間企業との連携を進める必要がある。

ほぼ全ての場合において、民間企業が保有するデータへのアクセスは有償であるが、目

的を共有し、データ提供でWin-Winの関係になるような働きかけをしている(ベルギー

やエストニアの携帯会社、アメリカの Twitter社などで成果が出始めている)。

3. データ、知見等の共有

各国政府が実施した取組(ほとんどが国内、一国単位での実施に留まる)を共有する場

として、GWG(Global Working Group)がある。

多数のプロジェクトで取得されるデータを用いて統計を作成し、また他部署で再利用す

るために、国連として ITプラットフォーム、API(アプリケーションインターフェース)

の開発を行う必要がある。

4. 新たな取組の意義、目的

開発したものを発展途上国向けに提供することで、当該諸国の関連する取組への投資額

を低減することを目指している。

Page 81: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

79

(2)調査先2:欧州連合統計局(EUROSTAT)

日時:2017年3月1日 10時-12時(現地時間)

場所:EUROSTATオフィス(Joseph Bech building, ルクセンブルク大公国)

担当:欧州連合 欧州委員会 EUROSTAT Big Data Task Force

議題:既存の公的統計の改善、新たな公的統計の研究、公的統計へのビッグデータ活用の取組

【ヒアリング結果概要】

1. 新たなデータソース

新たなデータとして、 Webscraping (イギリス、イタリア等)、Smart meters(エス

トニア、オーストリア、デンマーク等)、AIS6 data(オランダ、デンマーク等)、Mobile

phone data(ベルギー、エストニア等)等のパイロットプロジェクトを実施している。

Twitterのセンチメント分析は実施している(オランダ、スロベニア等)が、そもそも政

策への影響を明確に意図している恣意的な投稿もあり、取捨選択、クレンジングが非常

に重要である。

なお、ビッグデータを公式な統計として使うことについて、倫理的な指針・ガイドライ

ンの策定や、社会とのコミュニケーションのあり方(理解を促進するための方策)につ

いての検討を進めている。

2. 民間企業との連携

民間企業の保有する ITインフラやデータの利用は基本的に有償であり、ハッカソン等に

協賛する場合でも、自社ツールとそのサポートを提供するのみである場合が多い。

なお、欧州委員会の内部で小規模の ITインフラを作成、保持しており、実証実験や試験

的な取組が出来るような体制は整備している。

3. データ、知見等の共有

データやノウハウの共有の場として、ESS(European Statistical System)がある。

データ品質や ITインフラに求められる要件、整備手法について検討し、ガイドラインを

書いているが、これは水平的レビューの形をとっている。

4. 新たな取組の意義、目的

例えばスマートシティ等において、IoT 技術を利用したアプリケーション等が稼働して

しまう前に、データ処理の基準や必要となる機能要件等が最初から組み込まれるように、

現時点から産業界や標準化団体等と連携をしている。

ユーザーミーティングや委員会等で産業界や調査機関等と対話を行っているが、既存統

計へのフィードバックは子細な改善要望がほとんどであるため、大胆な構想(ビッグピ

クチャー)は我々がイニシアティブをとって推進していく必要がある。

データ提供を促すためにも、先ずは Early estimateを出して、ビッグデータでトレンド

6 Automatic Identification System:自動船舶識別装置

Page 82: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

80

を検知すること、新たなデータソースを使うことに慣れてもらい、マインドセットの変

換を図っている。

5. Smart Statistics(ポスト ビッグデータの取組)について

IoT普及後の世界の統計として、Smart Statisticsという概念を導入している。

自動運転車、スマートフォン、家電等からデータを集約、選別するシステムにインテリ

ジェンスを組み込み、リアルタイムに統計情報を作成、スマートなエネルギー、製品の

生産/消費を目指す。

Smart Statistics においては、人工知能(AI)技術が中核となり、新しいデータの生態

系が生まれるものと想定している。

統計機関の担う役割として、データの信憑性、信頼性を評価・確保することの重要性が、

益々高まることになると思われる。

(3)海外調査総括

UNSTATS では、事業において開発したツール等を発展途上国向けに提供することで、当該

諸国の関連する取組への投資額を低減することが、また、EUROSTAT では、産業界からのデ

ータ提供を促すため、ビッグデータでトレンドを検知するなど、新たなデータソースを使うこ

とに慣れてもらい、産業界のマインドセットを変えていくことが、重要な意義を持つことと認

識している。

また、UNSTATS、EUROSTATともに、ビッグデータ活用の基準やプラットフォーム等が乱

立することで、社会全体としての効率性が損なわれることを懸念しており、公的機関が民間に

先行してビッグデータの活用ノウハウや有用性の検証、基準の策定等を主導していくべきだと

認識している。

Page 83: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

81

別添資料

1 経済産業統計の一層の向上に向けたビッグデータ活用の提言(案)

(ビッグデータの利活用に関する有識者委員会)

2 実証事業報告書

① ジーエフケーマーケティングサービスジャパン株式会社

② 株式会社インテージリサーチ、株式会社インテージ

③ 野村證券株式会社

④ 株式会社エヌ・ティ・ティ・データ、公益財団法人流通経済研究所

Page 84: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

調査報告書 別添資料1

(案)

経済産業統計の一層の向上に向けた

ビッグデータ活用の提言

平成29年3月

ビッグデータの利活用に関する有識者委員会

Page 85: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

2

Page 86: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

3

目次

1.はじめに ............................................................................................................... 4

2.関連する国内外の動向 ......................................................................................... 4

(1)国内の動向 .................................................................................................... 4

(2)海外の動向 .................................................................................................... 5

3.ビッグデータ活用の可能性と課題 ....................................................................... 6

(1)ビッグデータ活用の可能性 ........................................................................... 6

(2)ビッグデータ活用における課題 .................................................................... 7

4.ビッグデータ活用の促進のあり方 ..................................................................... 10

(1)ビッグデータ活用の課題への対応............................................................... 10

(2)全体方針 ...................................................................................................... 10

Page 87: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

4

1.はじめに

本提言では、経済産業統計の一層の向上に向けて、民間企業が保有するPOSデータやサイバ

ースペース上に蓄積されているブログやTwitterを始めとしたソーシャルネットワーキン

グサービス(SNS)等の書き込み、政府等行政機関が保有する統計情報や行政記録情報等のビ

ッグデータについて、既存の政府統計への活用可能性と、活用にあたっての課題を提示する。

さらに、ビッグデータを活用して既存の政府統計の補完、拡充、詳細化、ならびに、従来の統

計よりも速報性に優れた指標を開発し、政府における迅速で正確な景気判断・政策決定を、また

民間においては迅速で的確な経営判断・意思決定を実現することを目指し、ビッグデータの活用

を促進するためのあり方について提言する。

2.関連する国内外の動向

(1)国内の動向

2016年6月に閣議決定された「経済財政運営と改革の基本方針2016(骨太方針20

16)」において、景気判断をより正確に行う観点から、行政記録情報やビッグデータ等の活用

を拡大するとし、同年12月21日には経済財政諮問会議において、新たなデータ源の活用の

推進を「統計改革の基本方針」の中の一つとして以下が決定された。

ビッグデータを活用した経済指標等の開発に当たっては、景気動向把握の向上に資するよ

う考慮するとともに、既存統計では把握できない経済活動の把握に努める。 (関係府省)

ビッグデータを用いた新たな景気動向のための指標として、POSデータをきめ細かく分

析に利用する手法の開発に向けた検討を行う。

また、物流データを活用した地域間の移出入の動向把握に向けて、調査機関と連携して研

究を進める。 (内閣府)

これを受け、関係府省において、早期かつ精緻な景気動向把握に資するビッグデータの活用の

促進やビッグデータ活用に関する環境・体制整備等の課題への取組が本格的に始まったところで

ある。

Page 88: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

5

(2)海外の動向

国際連合統計部(UNSTATS)や欧州統計局(EUROSTAT)などの国際機関における取組は、

協力の得られた個別の民間企業の保有データを用いた限定的な実証実験の域を出ておらず、そ

の有用性や社会還元のあり方を模索している段階にある。

新たに統計へ活用するデータとして、UNSTATSではMobile phone data、Social media、

Satellite imagery等、EUROSTATではWeb scraping (イギリス、イタリア等でパイロット

事業を実施)、Smart meters(エストニア、オーストリア、デンマーク等でパイロット事業を

実施)、AIS1 data(オランダ、デンマーク等でパイロット事業を実施)、Mobile phone data(ベ

ルギー、エストニア等でパイロット事業を実施)等に着目している。

UNSTATS では、事業において開発したツール等を発展途上国向けに提供することで、当該

諸国の関連する取組への投資額を低減することが、また、EUROSTAT では、産業界からのデ

ータ提供を促すため、ビッグデータでトレンドを検知するなど、新たなデータソースを使うこ

とに慣れてもらい、産業界のマインドセットを変えていくことが、重要な意義を持つことと認

識している。

また、UNSTATS、EUROSTATともに、ビッグデータ活用の基準やプラットフォーム等が乱

立することで、社会全体としての効率性が損なわれることを懸念しており、公的機関が民間に

先行してビッグデータの活用ノウハウや有用性の検証、基準の策定等を主導していくべきだと

認識している。

1 Automatic Identification System:自動船舶識別装置

Page 89: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

6

3.ビッグデータ活用の可能性と課題

ビッグデータ活用の可能性を探るため実施されたPOSデータやSNS等のテキストデータを

活用した新指標の開発実証事業や新経済産業指標開発コンテスト等の結果、更には「規制・ルー

ル整備検討WG」「マスター・システム整備検討WG」での議論等も踏まえ、有識者委員会として

以下のとおりビッグデータ活用の可能性と課題をとりまとめた。

(1)ビッグデータ活用の可能性

①迅速化

調査対象期間終了後から公表までの期間短縮を可能とする。

本事業の「POS データによる調査票提出プロセス検証のための実証実験(POS 実証実

験)」においては、店舗から配信された POS データを収集、集計し、経済産業省へ提出

するまでに要した期間は4日間であった。

四半期次、月次での公開から、週次、日次のように公表の高頻度化を可能とする。

本事業の「家電区分における POS データ集計値との比較・評価に係る実証事業(家電

POS 実証事業)」では、エアコン、電池、ラジオの週次、カメラ類の日次の販売金額を

それぞれ集計した。

②詳細化

商品分類別粒度の詳細化(大分類:加工食品⇒中分類:飲料⇒小分類:ソフトドリンクな

ど)ならびに、地域別粒度の詳細化(全国⇒都道府県別、都道府県別⇒市区町村別など)を

可能とする。

「家電 POS実証事業」においては、現状の商業動態統計、家電大型専門店における商品分

類6分類を、約100分類まで詳細化した。

③効率化

自動化により、調査への回答、収集、集計等、統計業務全般の作業効率化を可能とする。

「POS 実証実験」においては、小売業からの POS データの収集、日次での集計、経済産

業省への提出まで、一連のプロセスを自動化して実施した。

④高度化

金額データ(販売額)に加え、数量データ・平均価格データの提供なども可能とする。

「家電 POS 実証事業」においては、詳細化した分類(「テレビ」)の前年比増減について、

数量変化・価格変化の寄与度に分解した分析を実施した。

Page 90: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

7

⑤代替・補完

既存の政府統計を代替、また、既存統計では捉えられていなかった経済動向を把握する等、

既存の政府統計の補完を可能とする。

「家電 POS 実証事業」においては、実証事業の実施者である POS データ収集事業者が既

に保有している POS データと商業動態統計の家電大型専門店との突き合わせを行った結果、

88%程度のデータが合致、月次でのトレンドも一致し、既存統計代替の可能性を確認した。

また、「SNSデータを用いた新指標開発(SNS実証事業)」においては、AI技術を活用し

SNSデータ分析を実施。開発した新指標は中小企業業況判断DIと高い相関(相関係数0.

85)を示し、既存統計補完の可能性を確認した。

(2)ビッグデータ活用における課題

①データの収集・集積状況の観点

小売事業者において POSシステムは広く普及しており、また、多数の小売事業者から POS

データをビジネスベースで収集している民間事業者も既に存在しており、SNSデータにおい

ても同様の構造が見られることから、政府がビッグデータを収集する際にはこれら民間事業

者への十分な配慮が求められる。

なお、既存の統計調査の観点からは各 POSデータなどビッグデータ収集事業者がカバーし

ている範囲は、一部の例外を除き低く、また、既に収集しているデータにおいても、必要な

情報が不足している(ないしは既存ビジネスに不要なため除外してしまっている)場合があ

る。

②規制・ルールの観点

本事業での検討においては、将来的な調査スキームとして、以下の4パターン(参考)が

想定された。

「調査対象」(従来の統計調査における調査客体)が自らビッグデータ(ローデータ)を

「調査票の様式に準ずる様式」に加工・編集して国に直接提出するケース(パターン A-1)

「調査対象」がビッグデータを「代理提出事業者」に提出し、「代理提出事業者」がその

ビッグデータを「調査票の様式に準ずる様式」に加工・編集して国に提出するケース(パ

ターン A-2)

※「代理提出事業者」が、提出されたデータ等を第三者との自社ビジネスに活用するこ

とを可能とすることも想定している

「調査対象」がビッグデータを直接国に提出し、国が自ら又はデータ加工事業者に委託

して「調査票の様式に準ずる様式」に加工・編集するケース(パターン B)

国がビッグデータを収集・保有する「ビッグデータ収集事業者又はデータ市場等」から

Page 91: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

8

「調査票に掲げる事項」に必要な情報の提供を受け、国が「調査票の様式に準ずる様式」

に加工・編集するケース(パターン C)

パターン A-1、パターン B については、現行の統計調査と制度上の大きな差異はなく、ま

た、パターン C については、統計調査の位置づけにはならないと考えられるので、「調査対

象」は存在せず、基本的には現行制度上で制約が課されることはないのではないかと思われ

る。

公的統計へのビッグデータ活用に際しては、パターン A-2 のようなスキームも想定される

が、当該スキームについては現行制度と照らし合わせると、以下のような留意事項が挙げら

れる。

・留意事項

イ.統計調査として受け取ったデータには守秘義務が発生する為、当該データをそのまま

自社ビジネスに利用することは出来ない。

ロ.政府への報告データを代理作成する場合、作成資格や認定制度等を検討する必要があ

る。

なお、現行法上の解釈については、最終的に当局の確認を要するものである。

③マスター・システムの観点

・商品マスターについて

イ.既存統計の商品分類(例:商業動態統計の内容例示に示されている項目(テレビ・プ

ロジェクタ、パソコン・パソコン周辺機器等)については、詳細な定義が明示されて

おらず、どの分類に該当するかの判断(商品マスター機能)は調査客体に任されてお

り、商品マスターを構築する際にはこの定義を全て明らかにする必要がある。

ロ.報告項目は固定化を前提とすべきではなく、時勢に合わせて集計対象を適時に更新で

きるような体制とし、かつ、継続性維持の為、過年度の集計を再現できるように更新

の履歴を保持することが望ましい。

ハ.日々発売される新商品の分類対応等の為、民間の POSデータ収集事業者であっても相

当程度の作業コストを負担し、多くの人手をかけてマスターを整備・運用しており、

現時点では経済産業省の全ての統計をカバーする商品マスターを構築・維持していく

ことは非現実的であろう。

なお、先述の POS実証実験の実施者においては、約108万品目の商品マスターを整

備しているが、この運用には90名の専門スタッフを必要としている。

Page 92: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

9

・システムについて

イ.セキュリティ確保、コスト負担に十分配慮しつつ、膨大なデータ保管容量、データ加

工処理負荷の急増等に柔軟に対応可能な、拡張性・可用性に優れたシステム及び環境

を構築する必要がある。

「POS実証実験」においては、コンビニエンスストア4チェーン、約1,040店舗

を対象に、店舗別・JANコード別に集計処理したデータファイルを日次で経済産業省

に提出したが、実験実施期間における平均ファイル容量は、1 日あたり約216MB

であった。商業動態統計(平成29年1月)におけるコンビニエンスストアの店舗数

は55,828店舗と実証実験対象数の約55倍である。

また、「POS実証実験」の実施者においては、自社事業として約4,000店舗の POS

データのクリーニング、蓄積、集計等を実施しているが、この運用には25名の専門

スタッフ(50%程度の工数を割いている)を必要としている。

ロ.経済産業省としていずれのデータを受け入れるにせよ、受入れデータのフォーマット

を明示する必要がある。また、データの収集・集計・秘匿・公表や問合せ機能を持っ

たシステムの構築が必要である。

Page 93: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

10

4.ビッグデータ活用の促進のあり方

(1)ビッグデータ活用の課題への対応

①データの収集・集積状況

・統計調査の観点から必要なデータの収集・集積等については、調査対象への働きかけや、

民間の「ビッグデータ収集事業者」の既存システムの活用等を積極的に図ることで、効率

的かつ早期の事業推進を図るべき。

②規制・ルール

・現在の4パターン以外のスキームの有無について検討するとともに、今後取組を実施する

にあたって、各調査対象等の置かれている状況等を踏まえた、最適なパターンまたはその

組み合わせを検討し、関係部局とも協力して、必要となる規制・ルールの改正等を検討し

ていくべき。

③マスター・システム

・マスター、システム双方において、「ビッグデータ収集事業者」にて蓄積されたノウハウや

機能の活用を念頭に、民間事業者等における便益やコスト負担を踏まえた連携の在り方を

検討していくべき。

・膨大なデータを扱うことから人工知能(AI)などの積極的な活用も検討していくべき。

(2)全体方針

ビッグデータの活用については、将来的に既存統計の一部を代替・補完する可能性と、これ

までの統計とは異なる新たな指標開発の2つの可能性が考えられる。

既存統計の一部代替・補完の可能性については、「POS 家電実証事業」、「SNS 実証事業」そ

れぞれの実証事業において、その有用性が確認され、新たな指標開発の可能性については、「新

しい経済産業指標開発コンテスト(コンテスト実証事業)」の実施を通じ、学術界、産業界にお

ける、オープンデータとビッグデータを組み合わせた新指標開発研究が推進されるなどの一定

の成果が得られた。

ビッグデータを活用した新たな指標の安定的な作成・公表に向けて解決すべき課題があるも

のの、以下の取組を継続すべき。

・POSデータを活用した商業動態統計の家電大型専門店売上相当の新指標や、AIを使って

SNS等のテキストデータを分析した中小企業景況感指数等、一部には先行して作成・公表

Page 94: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

11

を見込める新指標もあり、今後、精度の更なる向上を図った上で、公開スキームを検討し、

出来るだけ早期に公開してその有用性や改善要望等について意見を募ることで適切な改善に

つなげるべき。さらに、商業動態統計の他業態への横展開を図ることが望ましい。

・ハッカソンやコンテスト等の取組を活用しつつ、公開されている統計情報や行政記録情報等

を含めたより幅広いビッグデータの活用可能性につき、引続き検討していくことが望ましい。

Page 95: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

12

参考

<将来的な調査スキームの想定パターン>

Page 96: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

調査報告書 別添資料2

平成28年度

IoT推進のための新産業モデル創出基盤整備事業

(ビッグデータを活用した新指標開発事業)

実証事業報告書

① ジーエフケーマーケティングサービスジャパン株式会社

② 野村證券 株式会社

③ 株式会社インテージリサーチ

株式会社インテージ

④ 株式会社エヌ・ティ・ティ・データ

公益財団法人流通経済研究所

Page 97: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

平成28年度

IoT推進のための新産業モデル創出基盤整備事業

(ビッグデータを活用した新指標開発事業)

実証事業報告書

平成29年3月

ジーエフケーマーケティングサービスジャパン株式会社

Page 98: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

目次

はじめに .................................................................................................................................. 1

1.1 本事業における当社担当領域について ............................................................................... 1

1.2 当社 POSデータについて ................................................................................................... 1

1.3 実証実験の内容 ................................................................................................................... 2

商業動態統計の POSデータによる代替可能性の検証 ........................................................... 3

2.1 商業動態統計と POSデータの比較・検証プロセスについて ............................................ 3

2.2 Phase1 当社標準データとの比較・検証 .......................................................................... 3

2.3 Phase2 再集計データとの比較・検証 .............................................................................. 5

2.4 Phase3 名寄せ後データとの比較・検証 .......................................................................... 7

商業動態統計と当社 POSデータの差異について .................................................................. 10

商業動態統計に近似させるための課題 ................................................................................... 11

4.1 差異の要因と 3つの課題 ..................................................................................................... 11

4.2 3課題の解決手段................................................................................................................. 12

商業動態統計の POSデータによる代替可能性に関する総括 ................................................ 13

新指標開発①カテゴリー細分化.............................................................................................. 14

新指標開発②販売数量・平均単価への要素分解 .................................................................... 16

新指標開発③カテゴリー細分化(週次) ............................................................................... 18

新指標開発③カテゴリー細分化(日次) ............................................................................... 20

新指標開発④カテゴリー及びタイムラインの細分化と要素分解を組み合せた分析 ............. 21

【参考】平成 26年商業統計と当社データとの比較・検証 ................................................... 21

Page 99: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

1

はじめに

1.1 本事業における当社担当領域について

当社は平成 28年度 IoT推進のための新産業創出基盤整備事業(ビッグデータを活用した新指標

開発事業)における「iii ) POS等のビッグデータを活用した新指標開発」領域を担当し、POSデー

タを使用した実証実験を実施した。

本事業の委託元である経済産業省は、従来より正確に経済動向や消費動向を把握するため政府統

計の高度化に向けた取り組みを積極的に行っており、一般統計として開始された専門量販店販売統

計調査(家電大型専門店・ドラッグストア・ホームセンター対象)を平成 27年 7月に基幹統計の商

業動態統計に組み入れるなど、法整備を含めた改革を推進している。また、民間企業が保有する様々

なビッグデータを利活用した政府統計の可能性について調査・検証を行うなど、その活動は省内に

留まらない。1

このような経済産業省の取り組みを加味し、当社が担当する領域ではビッグデータをベースとし

た消費動向や経済動向を調査する新たな指標を開発すると共に、経済産業省の既存統計を正確性や

速報性を持った、より高度な新指標で代替するフィージビリティ・スタディを実施するため、POS

データを用いて調査された新指標と経済産業省の既存統計との比較・検証を行った。また、POSデ

ータを用いることによって様々な角度から既存統計の要因分析が可能となると考えており、こちら

についても新指標として開発を行うこととした。

なお、当社が集計する POSデータは主に家電量販店から集信されたものであるため、実証実験で

開発を進めた新指標は家電販売市場の側面から消費動向や経済動向を概観するものとなっており、

商業動態統計で言えば丁 2調査票「家電大型専門店販売」に該当するものである。そのため、既存

統計の代替に関するフィージビリティ・スタディでは商業動態統計の丁 2調査票「家電大型専門店2

販売」を対象とし、比較・検証を行った。

1.2 当社 POSデータについて

日本国内の家電販売店における POSデータの導入は 1980年代後半から進み、当社は平成元年 7

月に家電販売店の POSデータを収集し販売動向を集計するオンラインデータベースのプラットフ

ォーム「ACSISS-E」を立ち上げ、家電メーカー等へ調査結果の提供を開始した。「ACSISS-E」は

1 「平成 27 年度ビッグデータとその解析技術を活用した新指標の開発事業」 2 日本標準産業分類に掲げる細分類 5931-電気機械器具小売業(中古品を除く)又は細分類 5932-電気事務機械器具小売業(中古品を除く)に属する事業所

(売場面積 500 ㎡以上の家電大型専門店) を 10 店舗以上有する企業

Page 100: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

2

その後集計対象企業を増やし、平成 29年 3月現在、商業動態統計で定義される家電大型専門店につ

いてはほぼ全ての企業から POSデータを収集している。本領域ではこの「ACSISS-E」データを使

用して実証実験を実施した。

当社 POSデータから集計した調査結果(販売動向データ)の最小単位は製品型番別(JANコー

ド別)の販売数量・金額となり、全国及び 5地区別3 データを基本としている。

本実証実験ではこの最小データを積み上げ、テレビや冷蔵庫などの小分類別、AV家電や生活家電

の大分類別に分析を行い、新指標の開発を進めた。

1.3 実証実験の内容

当社が担当する「iii ) POS等のビッグデータを活用した新指標開発」領域では次の新指標開発を

想定して実証実験を進めた。

経済産業省の商業動態統計丁 2調査票「家電大型専門店販売」を代替する、POSデータによって調査された新指標(フィージビリティ・スタディ)

商業動態統計丁 2調査票「家電大型専門店販売」の要因分析のための新指標

その他家電販売市場に関する新指標

当社 POSデータは商業動態統計の調査対象企業を網羅している可能性が高く、丁 2調査票を代替

する新指標を開発した場合のフィージビリティに期待が持てる。そのため、本実証実験では特に(1)

にリソースを集中させ、商業動態統計の POSデータによる代替可能性について詳細な検証を行った。

なお、当社 POSデータの網羅性については最終的に商業動態統計の個票開示に関する申請を行い、

集計対象企業の確認を行った際に確認ができた。

3 5 地区の区分は次の通り。(北海道・東北/関東・甲越/東海・北陸/中国・四国・九州・沖縄)

Page 101: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

3

商業動態統計の POSデータによる代替可能性の検証

2.1 商業動態統計と POSデータの比較・検証プロセスについて

前項に記したように商業動態統計を代替する新指標の開発についてはフィージビリティの観点か

ら重点的に実施する必要があると考え、社内リソースを集中的に配置し、本事業の開始が決定した

後早急に比較・検証に着手した。比較・検証は当社クライアントに定期的に配信している標準デー

タから始まり、最終的には商業動態統計の個票開示請求を行い、集計対象企業を名寄せした状態の

データも使用して精緻に実施した。比較・検証のプロセスは次の図の通りである。

(図1) 商業動態統計と当社 POSデータの比較・検証プロセス

(各 Phaseで使用したデータの詳細は次ページ以降に記す)

2.2 Phase1 当社標準データとの比較・検証

商業動態統計と POSデータの比較・検証プロセスの第一段階として、まずは当社がクライアント

に定期的に配信している標準データ(以下「Phase1データ」)と商業動態統計丁 2調査票「家電大

型専門店販売」との比較を行った。この Phaseは双方のデータのトレンドの把握、定義が異なる箇

所の精査、有識者委員への比較・検証結果速報値の報告を目的としている。期間は平成 27年度(平

成 27年 4月~平成 28年 3月)の 12か月間で比較・検証した。結果、商業動態統計と当社標準デ

ータとの間には全体で 11%の差異(当社データが 11%少ない)があることが判明したが(図 2)、

月次で両者のトレンドを比較した場合に大きな差異は確認できなかった(図 3)。また、商業動態統

計と当社標準データの商品分類定義に違いがあり(表 1)、当社データの再集計が必要であることが

分かった。この結果を平成 28年 11月 7日開催の第一回有識者委員会(キックオフ)にて報告した。

Page 102: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

4

(図2) 当社標準データ「Phase1データ」と商業動態統計丁 2調査票の差異

(図3) 当社標準データ「Phase1データ」と商業動態統計丁 2調査票の前年比の比較

Page 103: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

5

(表1) 当社標準データ「Phase1データ」と商業動態統計丁 2調査票の分類定義の違い

なお、[Phase1]データ(当社標準データ)は、家電販売市場における網羅性を可能な限り高めた

データをクライアントへフィードバックするため、当社が集信しているほぼ全ての流通企業の POS

データを集計した最大母集団で構築されている。そのため、次の Phaseでは当社が集信している

POSデータの内、丁 2調査票対象企業と想定される企業の POSデータのみを集計し、更に分類定

義を商業動態統計の商品分類表4 に例示された内容に一致させ、[Phase2]データ(再集計データ)

を構築して再度商業動態統計との比較・検証を実施する。

2.3 Phase2 再集計データとの比較・検証

Phase1での比較・検証結果から、商業動態統計と当社標準データでは集計対象企業と商品分類の

定義が異なることが判明した。Phase2では商業動態統計と POSデータの精緻な比較・検証を実施

するために当社 POSデータを商業動態統計の定義に合わせて再集計した。再集計の内容は以下の通

りである(図 4)。

4 商業動態統計の商品分類表は以下に例示されている。

http://www.meti.go.jp/statistics/tyo/syoudou/result/excel/h2schu8j.xls

Page 104: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

6

(1) 分類定義の調整

ビデオカメラを「AV家電」から「カメラ類」に移動

GPSナビゲーションを「情報家電」から「AV家電」に移動

交換レンズやカメラアクセサリを「カメラ類」に追加

スマートフォン関連商品(ケースなどのアクセサリー)を「通信家電」に追加

大分類「その他」を追加。「その他」は商業動態統計の定義に例示されている商品を網羅。

他に内容例示されている商品で当社標準データに含まれていなかった商品を追加。(商業動態統計の内容例示に準拠)

(2) 集計対象企業の調整

当社が集信する POSデータの内、丁 2調査票が調査対象としている企業5 のみを集計。

(図4) 「Phase2データ」再集計の内容

Phase2では上記内容にて再集計した POSデータを用いて平成 27年 11月~平成 28年 10月の

12か月間の販売動向データを作成し、それを「再集計データ[Phase2データ]」とし、同期間の商動

動態統計と比較・検証を実施した。結果、「再集計データ[Phase2]データ」と商業動態統計との間に

12%の差異(当社データが 12%少ない)が確認できた(図 5)。また、Phase2で初めて比較・検証

を行った「その他」分類については差異が 69%と他分類と比較して大きい結果となった(当社デー

タが 69%少ない)。

5 日本標準産業分類に掲げる細分類 5931-電気機械器具小売業(中古品を除く)又は細分類 5932-電気事務機械器具小売業(中古品を除く)に属する事業所

(売場面積 500 ㎡以上の家電大型専門店) を 10 店舗以上有する企業

Page 105: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

7

(図5) 再集計データ「Phase2データ」と商業動態統計丁 2調査票の差異

2.4 Phase3 名寄せ後データとの比較・検証

Phase1から Phase2の比較・検証で商業動態統計と当社 POSデータの差異を確認し、平成 29

年 2月 2日開催の中間報告会において数値の報告を行ったところ、有識者委員より正確な比較・検

証を行うために商業動態統計丁 2調査票個票の確認が必要との指摘を受けた。当社としても差異が

発生する要因を精緻に検証するためには集計対象企業の名寄せが必要と考えており、経済産業省協

力の上、商業動態統計丁 2調査票個票の開示請求を行った。その後本事業に限り利用可能な個票の

貸与を受けた。

貸与された個票を確認し、商業動態統計丁 2調査票と Phase2の再集計データ([Phase2データ])

で集計対象企業の名寄せを実施したところ、[Phase2データ]の方が 2社多いデータとなっていた(家

電大型専門店 2社)。そのため、該当する家電大型専門店 2社を削除した新たな母集団の POSデー

タを構築し、「名寄せ後データ[Phase3データ]」として集計、再度商業動態統計との比較・検証を

実施した(図 6)。

Page 106: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

8

(図6) 当社 POSデータにおける商業動態統計(商動)丁 2調査票との集計内容の違い

Phase3では上記内容にて再集計を実施した名寄せ後の[Phase3データ]を使用して Phase2と同

じく平成 27年 11月~平成 28年 10月の 12か月間で販売動向データを作成し、同期間の商動動態

統計と比較・検証した。結果、商業動態統計との間に 12%の差異(当社データが 12%少ない)が

確認できた(図 7)。集計対象企業の相違が 2社のみであったため、Phase2での検証(11%の差異)

とほぼ同じ結果となった。また、分類別に差異を検証した結果も Phase2とほぼ同等であった。更

に月次トレンドについて検証するため、平成 27年 11月期を 100とした場合の平成 27年 11月期~

平成 28年 10月期の指数について商業動態統計と[Phase3データ]の比較と行ったが(図 8)、商業

動態統計と名寄せ後データ[Phase3データ]との間に大きなトレンドの相違は見られなかった

(図7) 名寄せ後データ「Phase3データ」と商業動態統計丁 2調査票の差異

Page 107: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

9

(図8) [Phase 3データ]と商業動態統計との比較:月次トレンド(販売金額指)

Page 108: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

10

商業動態統計と当社 POSデータの差異について

商業動態統計丁 2調査票「家電大型専門店販売」の POSデータによる代替可能性について検証す

るため、3つの Phaseで商業動態統計と当社 POSデータの比較を進めた。Phase2では集計分類と

集計対象企業の定義を調整し、Phase3では商業動態統計個票の開示申請を行い、貸与された個票を

元に集計対象企業の名寄せを実施した。最終的には集計対象企業、地区別区分、分類定義の 3要素

を一致させた上で商業動態統計と当社 POSデータの比較を行ったのであるが、12%(2015年 11

月~2016年 10月)の差異が残る結果となった。

差異が発生する要因について検証を行った結果、当社 POSデータの数値を増加させる要因と当社

POSデータの数値を減少させる要因の双方が推定された。それぞれの要因は以下の通りである。

・当社 POSデータの数値を増加させる要因

(1) フランチャイズ店販売実績集計の有無

(2) 携帯電話専門店・キャリアショップ販売実績集計の有無

(3) スマートフォンなど携帯端末の価格基準の違い(一括販売、割賦販売など)

・当社 POSデータの数値を減少させる要因

(4) 家電大型専門店通信販売実績集計の有無

(5) 「その他」分類に含まれる商品(非家電製品等の集計の有無)

(6) アウトレット/中古商品販売実績集計の有無

(7) 法人向けアカウントでの販売実績集計の有無

(8) 当社集計対象外製品(パーツ類等商品 POSマスタがない細かな商品の集計の有無)

(9) 工事費や設置費の販売実績集計の有無

これらの要因が相殺されて 12%の差異が発生していると考えられる。なお、この内最も影響が大

きい要因は【(5)「その他」に含まれる商品】である。

Page 109: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

11

商業動態統計に近似させるための課題

4.1 差異の要因と 3つの課題

前項では商業動態統計丁 2調査票と名寄せ後の当社 POSデータ[Phase3データ]を比較し、確

認された差異の要因について検証した。本項では明らかとなった 9つの差異要因を次の 3課題に分

け、商業動態統計の POSデータによる代替可能性を検証するため、当社 POSデータを商業動態統

計に近似させる手段を検討した。

【課題 1】:店舗形態に起因する課題

① フランチャイズ店販売実績集計の有無

② 携帯電話専門店・キャリアショップ販売実績集計の有無

③ 法人向けアカウントでの販売実績集計の有無

【課題 2】:通信販売に起因する課題

① 家電大型専門店通信販売実績集計の有無

【課題 3】:商品定義に起因する課題

① スマートフォンなど携帯端末の価格基準の違い(一括販売、割賦販売など)

② 「その他」分類に含まれる商品(非家電製品等の集計の有無)

③ アウトレット/中古商品販売実績集計の有無

④ 当社集計対象外製品(パーツ類等商品 POSマスタがない細かな商品の集計の有無)

⑤ 工事費や設置費の販売実績集計の有無

POSデータを商業動態統計に近似させるための課題とその解決手段をまとめると次の(図 9)と

なる。

Page 110: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

12

(図9) POSデータを商業動態統計に近似させるための課題とその解決手段

4.2 3課題の解決手段

【課題 1】:店舗形態に起因する課題

店舗形態に起因する課題については店舗別データの集信を行うことにより解決可能と考える。家

電大型専門店から店舗別また、アカウント別(法人アカウント等を識別)データを集信し、当社シ

ステム上で仕分けを行えば、商業動態統計の数値に近似させることが可能と考える。

なお、店舗別、アカウント別データを集計することにより、既存店の販売動向が分析できるとい

う副産物が生まれる。家電販売市場を分析する指標が増えるだけではなく、データ送信元の家電大

型専門店に店舗展開や人員配置等の戦略立案に有益な指標をフィードバックすることでき、官民双

方にとってメリットのある結果が期待できる。

【課題 2】:通信販売に起因する課題

通信販売に起因する課題については家電大型専門店からインターネット販売等通信販売分の販売

実績データを集信し、販売動向データとして集計することにより解決可能である。

なお、家電大型専門店企業においてはテレビ通販、カタログ販売等その他の通信販売形態の比率

は極めて少なく、インターネット販売分を集計することができれば通信販売に起因する課題は解決

すると考える。

【課題 3】:商品定義に起因する課題

商品定義に起因する課題については商品定義の設定とマスタ整備によって解決可能である。集計

対象とする商品の定義を厳密に設定し、それに従って POSデータのマスタを整備することにより、

集計対象の商品と対象外の商品を識別、高い精度で販売動向データを集計することが可能となる。

Page 111: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

13

商業動態統計の POSデータによる代替可能性に関する総括

ここまで商業動態統計と当社 POSデータの間に確認できた差異の要因、POSデータを商業動態

統計に近似させるための課題、更にその解決手段について検証した。差異要因の検証については商

業動態統計の個票を確認し、集計対象企業を名寄せすることができたため、差異の数値を正確に算

出した上で実施することができた。課題の解決手段についてはシステム構築やマスタ整備など当社

が物量で解決できる課題と、経済産業省や家電大型専門店との調整が必要な課題に分かれるが、ど

ちらも解決に必要な手段は判明している。そのため、商業動態統計の数値に近似させることは不可

能ではないと考える。一方で携帯端末の価格基準や中古販売など商業動態統計の調査手法では精緻

に集計することができないと考えられる要素については、POSデータを商業動態統計に近似させる

のではなく、新たな定義を厳密に設定し、それに応じたマスタを整備した上で POSデータにて集計

された値を正とするなどの検討が必要である。

POSデータにより集計された指標は正確性、速報性に優れており、官民双方にとって利用価値が

ある。また、POSデータ集信から販売動向データ集計まで自動化されたプロセスで完了するため、

家電大型専門店の調査票回答者や商業動態統計集計担当者の負担軽減にも繋がる。次項では POSデ

ータを使用することによるメリットを活かした要因分析のための新指標についてまとめるが、商業

動態統計を POSデータで代替することによって得られる効果は要因分析に留まらない。今後も明ら

かとなった課題の解決に向けた取り組みと実施すると共に、引き続き商業動態統計の代替可能性に

ついて検証し、POSデータ等ビッグデータを利活用した新指標を開発していきたい。

Page 112: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

14

新指標開発①カテゴリー細分化

本章では、AV家電、生活家電、通信家電などのカテゴリー別販売金額前年比をテレビ、プロジェ

クタなどの製品別の動態に細分化することにより、カテゴリーの動態をより精緻に捉えることを目

指す。本指標により実際にカテゴリーの動きに大きく起因している製品群が明らかになる。結果、

従来よりも商業動態の実態に即した指標が得られることが期待される。

今回使用するデータの条件は以下の通りである。

(表2) 分析対象データ条件

使用データ 「再集計データ[Phase2データ]」を使用。当社が集

信している POSデータの内、日本標準産業分類に掲

げる細分類 5931-家電機械器具小売業又は細分類

5932-電気事務機機械器具小売業(中古品を除く)

に属すると想定される家電大型専門店を集計。各企業

内の同一 POSネットワーク上に存在する店舗(ただ

し、法人アカウント、通信販売専用アカウントは除く)

における、商業動態統計の内容例示を網羅した分類定

義により集計された販売動向データ。

対象製品カテゴリー名称 AV家電

対象製品カテゴリーに属

する製品名称

テレビ

プロジェクタ

ビデオディスク

BD・DVD(再生専用、録画再生機)

BS・CS機器

ステレオ

スピーカ

AV編集機器

ラジオ・ポータブルオーディオ

GPSナビゲーション

ヘッドホン

マイクロホン

AV接続機器

電子楽器

VTR

携帯オーディオ機器

ホームオーディオ機器

他オーディオ関連

メディアクリーナ

その他 AV家電(~等)

データ期間 2014年 12月~2016年 11月

使用値 月次販売金額

上記のデータ条件に従う場合、製品カテゴリーの販売金額前年比は 2015年 12月から 2016年 11

月までの 12か月分を得る。また各製品の販売金額の月次差分も同様である。

Page 113: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

15

2015年 12月から 2016年 11月までにおける AV家電の販売金額前年比に対する各製品の寄与度

を図示したものを以下に示す。

(図10) AV家電の販売金額前年比と各製品の販売金額の寄与度

(2015年 12月~2016年 11月)

AV家電の販売金額前年比の折れ線グラフから、2016年 3月と同 8月において AV市場の販売金

額が前年から特に落ち込んだ様子が読み取れる。さらに製品別寄与度を表す棒グラフをみると、

2016年 3月の落ち込みは特にテレビ販売の下落が主要因であり、同 8月はテレビに加えて携帯オー

ディオ機器の販売下落も大きな要因であるとの実態が確認できる。このように、製品カテゴリー単

位よりも細分化することによって、商業動態の実態を従来よりも明確に捉えることが可能になる。

Page 114: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

16

新指標開発②販売数量・平均単価への要素分解

本章では、商業動態統計の対象である販売金額を販売数量と平均単価の積に要素分解することに

より、商業動態の変化について新たな視点を与える。

家電製品市場では、販売数量データがシーズナリティを持つことや新製品発売によって平均単価

が変化することは珍しくない。したがって、販売金額の変動を理解する上で販売数量と平均単価は

欠かせない要素と言える。

今回使用するデータの条件は以下の通りである。

(表3) 分析対象データ条件

使用データ 「再集計データ[Phase2データ]」を使用。当社が集信

している POSデータの内、日本標準産業分類に掲げる

細分類 5931-家電機械器具小売業又は細分類 5932-

電気事務機機械器具小売業(中古品を除く)に属すると

想定される家電大型専門店を集計。各企業内の同一

POSネットワーク上に存在する店舗(ただし、法人ア

カウント、通信販売専用アカウントは除く)における、

商業動態統計の内容例示を網羅した分類定義により集

計された販売動向データ。

対象製品名称 テレビ

データ期間 2014年 12月~2016年 11月

使用値 月次販売金額、月次販売数量、月次平均単価

2015年 12月から 2016年 11月までにおけるテレビの販売金額前年比に対する販売数量と平均単

価の寄与度を図示したものを以下に示す。

(図11) テレビの販売金額前年比と数量変化・価格変化の寄与度

(2015年 12月~2016年 11月)

Page 115: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

17

上図の赤い棒グラフは各月の販売金額前年比に対する販売数量変化の寄与度を、緑色の棒グラフ

は平均単価変化の寄与度をそれぞれ表している。この図から 3月と 7月の金額変動は数量に起因す

るところが大きいことや、6月における販売金額前年比の成長は平均単価の上昇に起因しているこ

となどが分かる。

さらに販売数量や平均単価の変動をみることの有効性は、単月毎の寄与度を知るだけにはとどま

らない。例えば、販売数量データを長期的な時系列データとしてみるならば、移動平均を算出する

ことによって分析対象製品の商業動態のトレンドを知ることもできる。その例として、上記で用い

たテレビの販売データを基に、販売数量と平均単価の 13ヶ月移動平均を算出した結果をグラフで示

しておく。ただしグラフでは 2016年 1月を 100とする指数を用いた。

(図12) テレビの販売数量/平均単価の増減トレンド

(2016年 1月~2016年 11月)

Page 116: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

18

新指標開発③カテゴリー細分化(週次)

1. 目的

本章では、時間軸をより細分化することを考える。具体的には、前項までの月次ベースのデータ

ではなく週次ベースのデータを用いることによって、気象条件等の局地的なイベントが販売に与え

る影響を精緻に分析することが可能となる。

まずは、局地的なイベントとして特定地域への台風上陸が当該地域における家電製品販売の動向

に与えた影響を考察する。

2. 分析対象データ

使用データ 「再集計データ[Phase2データ]」を使用。当社が集

信している POSデータの内、日本標準産業分類に掲

げる細分類 5931-家電機械器具小売業又は細分類

5932-電気事務機機械器具小売業(中古品を除く)

に属すると想定される家電大型専門店を集計。各企業

内の同一 POSネットワーク上に存在する店舗(ただ

し、法人アカウント、通信販売専用アカウントは除く)

における、商業動態統計の内容例示を網羅した分類定

義により集計された販売動向データ。

対象製品名称 電池、ラジオ

データ期間 2014年 6月 23日週~2014年 8月 4日週

使用値 週次販売金額

3. 結果

以下に、家電製品全体、電池およびラジオの販売金額前週比の推移を示す。

(図13) 家電全体の 5地区別対前週比推移(販売金額)

Page 117: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

19

(図14) 電池の 5地区別対前週比推移(販売金額)

(図15) ラジオの 5地区別対前週比推移(販売金額)

気象概況を述べると、7月 10日に台風 8号が鹿児島県に上陸した。電池とラジオの対前週比を見

ると、7月 7日週に中国・四国・九州・沖縄地方で顕著な伸びを示している。家電製品全体の週次

販売動向を見ると、祝日を含む 7月 21日週およびその翌週である 7月 28日週で前週比が動いてい

ることを除いて顕著な動きは見られなかった。このため、7月 7日週に中国・四国・九州・沖縄地

方で顕著な伸びを示した電池とラジオの販売動向は特異だったと言える。台風襲来の停電に備えて

事前にラジオと電池を購入する消費者が多かったと推測される。

Page 118: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

20

新指標開発③カテゴリー細分化(日次)

1. 目的

本項ではタイムラインを更に細分化し、日次データの活用による分析事例について触れる。

2. 分析対象データ

使用データ 当社がクライアントに定期的に配信している標準デ

ータ(「Phase1データ」)を使用。弊社定義による家

電販売店企業を集計。各企業内の同一 POSネットワ

ーク上に存在する店舗(ただし、法人アカウント、通

信販売専用アカウントは除く)が対象。

対象製品名称 カメラ類

データ期間 2015年 4月 25日~2015年 5月 8日、

2016年 4月 25日~2016年 5月 8日

使用値 日次販売金額

3. 結果

以下に、2015年および 2016年の大型連休期間における家電量販店でのカメラ類の販売金額推移

を示す。

(図16) 2015年の大型連休期間中におけるカメラ類の日別販売金額指数

(4月 27日の販売金額を 100として指数化)

Page 119: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

21

(図17) 2016年の大型連休期間中におけるカメラ類の日別販売金額指数

(4月 25日の販売金額を 100として指数化)

2015年、2016年ともに休日の販売金額は、平日の 1.5倍以上になっていることが分かる。ただ

し、2015年が大型連休突入前の週末の販売のピークが来ているのに対し、2016年は 4月 29日に販

売のピークが来ている。また、2016年は平日である 4月 28日も高い販売指数を示している。みど

りの日である 4月 29日が金曜にあたり、そのまま週末に差し掛かるカレンダーの並びだったため、

4月 28日から休暇に入った人も多かったものとみられる。以上のように、タイムラインを週次から

日次に細分化することで、曜日別の販売動向の違いや、カレンダーの並びによる販売動態の変化な

ど、週次データでは見えなかった動態の分析が可能となる。

新指標開発④カテゴリー及びタイムラインの細分化と要素分解を組み合せた分析

1. 目的

本章では、カテゴリー及びタイムラインの細分化と要素分解を組み合わせた分析事例として、POS

データと気象庁オープンデータである気象データを用いた季節家電(エアコン)の需要分析を実施

する。POSデータの活用によりデータ細分化が可能となり、更に数量の要素を利用できることで、

商業動態のより深い分析が可能となる。

2. 分析対象データ(季節家電(エアコン)の需要分析)

使用データ 当社がクライアントに定期的に配信している標準デ

ータ(「Phase1データ」)を使用。弊社定義による家

電販売店企業を集計。各企業内の同一 POSネットワ

ーク上に存在する店舗(ただし、法人アカウント、通

信販売専用アカウントは除く)が対象。

Page 120: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

22

対象製品名称 エアコン(カテゴリーの細分化)

データ期間 2009年~2016年の各年における 6月~8月に含まれ

る週

使用値 週次販売金額、週次販売数量

(タイムラインの細分化及び要素分解による数量の

データの利用)

3. 結果

2009年~2016年におけるエアコンの週間販売数量の推移を以下に図に示す。平均値の推移を見

ると、夏場におけるエアコン販売は 6月から 7月にかけて徐々に増加しており、7月 2週をピーク

に今度は 8月にかけて徐々に減少していくことが分かる。しかしながら、各年の販売推移を示す折

れ線グラフに注目すると、販売推移は年によって大きく異なっている

(図18) エアコンの年別週次販売数量動向

4. 要因分析

前述したとおり、夏場のエアコン販売は年によって動向が大きく異なる。この背景として、エア

コン販売が外部要因である「気温」の動きに大きく左右されることが挙げられる。ここでは、気象

データの1つである「平均気温」を利用し、エアコン販売と平均気温間の相関を分析する。

(表4) 分析対象データ条件(販売データ)

使用データ 当社がクライアントに定期的に配信している標準デ

ータ(「Phase1データ」)を使用。弊社定義による家

電販売店企業を集計。各企業内の同一 POSネットワ

ーク上に存在する店舗(ただし、法人アカウント、通

信販売専用アカウントは除く)が対象。

対象製品名称 エアコン(カテゴリーの細分化)

データ期間 2009年~2016年の各年における 6月~8月に含まれ

る週

Page 121: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

23

対象地区 関東・甲越地区

(東京都、神奈川県、埼玉県、千葉県、茨城県、群馬

県、栃木県、山梨県、新潟県)

使用値 週間販売数量

(タイムラインの細分化及び要素分解による数量の

データの利用)

(表5) 分析対象データ条件(気象データ)

使用データ 地域気象観測システム AMeDAS(以降アメダスと表

記)にて観測された気象データ

データ期間 2009年~2016年 6月~8月に該当する週

対象地点 横浜

使用要素 週間平均気温

週間販売数量と週間平均気温については、以下の通り指数化したものを用いる。

・販売指数

2009年~2016年までの各週の販売数量の平均を 100とした時の販売指数

・気温平年差

2009年~2016年までの各週の平均気温を 0とした時の気温差

以上のデータを用いて、各週のエアコン販売指数と平均気温の気温平年差をプロットしたものが

下図である。

(図19) エアコン販売と平均気温間の散布図

縦軸:販売指数(関東・甲越地区)

横軸:気温平年差(アメダス地点:横浜)

※点線は線形近似曲線

y = 19.117x + 99.8

R² = 0.6106

0

50

100

150

200

250

-4 -2 0 2 4

Page 122: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

24

本図より、気温平年差が高くなるほど、エアコン販売指数も高くなる傾向が見て取れる。該当期

間において、エアコン販売指数と気温平年差間の相関係数は0.78となり、強い正の相関が見られた。

5. 天気予報の活用について

夏場の家電販売動態はエアコンの動きに左右され、そのエアコンの販売動態は、気温の動きに左

右されることが分かった。つまりは、気温の予測が出来れば、大まかな家電販売動態の推移を事前

に予想することが出来ると言える。ここでは、気象庁が発表する天気予報、季節予報を用いた家電

販売動態の予測可能性について考察する。

(表6) 予報データ

使用データ 気象庁発表 異常天候早期警戒情報

データ期間 2015年 6月 1日週~2015年 8月 24日週

対象地域 関東・甲越

予報日 前週木曜日

使用要素 週間平均気温

(表7) 観測データ

使用データ 地域気象観測システム AMeDAS(以降アメダスと表

記)にて観測された気象データ

データ期間 2015年 6月 1日週~2015年 8月 24日週

対象地点 横浜

使用要素 週間平均気温

下図は 2015年夏場における前週木曜日に発表された予報気温と、実際に観測された気温の推移

を表したものである。なお、数字は 2008年~2014年の平均気温の平均に対する温度差を表してい

る。

Page 123: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

25

(図20) 平均気温 予報データと観測データの推移比較

縦軸の数値は 2008年~2014年の平均気温の平均に対する温度差(℃)

上記期間において、予報気温と実際に観測された気温の乖離は平均で 1.1℃となった。また気温

が平年より高くなると予報された週は 10週間あるが、そのうちの 8週間で実際に観測された気温

も平年より高くなった。

以上より天気予報の活用は、特別なイベントが無い年における夏場の家電販売動態の傾向を把

握することにおいて有用であると考える。

Page 124: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

26

【参考】平成 26年商業統計と当社データとの比較・検証

当社が担当した「iii ) POS等のビッグデータを活用した新指標開発」において、実証実験の中核

となった領域は商業動態統計の POSデータによる代替可能性についての検証であるが、商業動態統

計と当社 POSデータとの間には、家電大型専門店の店舗形態に起因する差異、通信販売に起因する

差異、商品定義に起因する差異があることが判明した。(「4.1 差異の要因と 3つの課題」参照)。

商業動態統計を POS等のビッグデータを使用した指標で代替していくためには、どの店舗形態や

販売形態(通信販売・店頭販売など)を調査対象とするか、また、どの商品を調査対象とするか、

つまり集計定義の明確化が必要であるが、集計定義の明確化は、人の手で回答・集計を行う調査票

をベースとした従来の調査手法では困難であった。しかし、POSデータによる調査では、単品別の

販売情報を集計した販売動向データを使用するため、子細に、かつフレキシブルに定義を設定する

ことが可能である。しかし、定義をこと細かく自由に設定できる以上、POSデータを使用した商業

動態統計の代替指標の精度は、必然的に集計定義の設定方法に左右されることとなる。正確性と網

羅性を併せ持った新指標を開発するために、商業動態統計以外の様々な統計と POSデータとの多面

的な分析を実施した上で集計定義の明確化に進むべきであると考え、本章では他統計との比較・検

証の一例として、「商業統計調査(平成 26年)」との比較・検証を実施した。なお、平成 26年商業

統計調査の内、当社 POSデータが集計対象としている家電大型専門店が該当する項目は「593 小

売業 機械器具小売業(自動車、自転車を除く)」である。

商業統計の項目と比較する当社 POSデータは、商業動態統計との比較・検証の[Phase1]で使用し

た「当社標準データ」とした。「当社標準データ」は当社クライアントへのフィードバックを目的と

して構築されており、当社が集信しているほぼ全ての流通企業の POSデータを集計し、家電販売市

場における網羅性を高めた最大母集団で構築されている。なお、データ期間は平成 26年商業統計調

査「商品販売額」の期間と同等の平成 25年 1月~12月の 12か月間とした。平成 26年商業統計調

査と「当社標準データ」を比較した結果、商業統計を 100%とした場合、当社標準データは 48%、

であった。(図 21)

Page 125: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

27

(図21) 商業統計(平成 26年)と GfK POSデータの比較:年間商品販売額の比較

平成 26年商業統計と「当社標準データ」との差異要因であるが、 [5933 中古電気製品小売業]

[5939 その他の機械器具小売業]の集計有無が挙げられる。商業統計ではこれら 2分類を集計対象

としているが、「当社標準データ」では中古製品は集計対象外としており、「その他の機械器具小売

業」業態についてはデータを集信していない。

また、「当社標準データ」は家電大型専門店の POSデータを中心に構成されており、小規模家電

店やインターネット販売専業企業、キャリアショップ・携帯電話専門店などについては集計対象外

としているため、これらの販売店の商品販売額が商業統計と「当社標準データ」との差異要因とな

っている。なお、商業動態統計との差異要因になっていた、商品定義に起因する差異などの要素に

ついても引き続き影響を与えていると考える。

100%

48%

0%

20%

40%

60%

80%

100%

全国

商業統計 機械器具小売業(自動車,自転車を除く)

GfK POSデータ [当社標準データ]

データ期間:2013年1月~2013年12月の1年間

Page 126: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

平成28年度

IoT推進のための新産業モデル創出基盤整備事業

(ビッグデータを活用した新指標開発事業)

実証事業報告書

平成 29 年 3 月

Page 127: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

目次

第1章.業務概要 .............................................................................................................. - 1 -

1-1.目的 .............................................................................................................. - 1 -

1-2.方法 .............................................................................................................. - 1 -

第2章.実証実験で利用する POSデータ収集・集計体制の概要 ..................................... - 2 -

2-1.インテージ SRIの概要 ................................................................................. - 2 -

2-2.PosPlatform の概要 ..................................................................................... - 4 -

第3章.実証実験の概要及び実施結果 .............................................................................. - 6 -

3-1.実証実験の概要 ............................................................................................ - 6 -

3-2.「インテージ SRI」を用いた集計データの作成 ........................................... - 7 -

3-3.小売事業者から POSデータの直接提出を想定しプロセスの実践 .............. - 17 -

第4章.小売事業者から POSデータを収集する体制構築に向けた考察 ........................ - 30 -

4-1.小売事業者からの POSデータの提供方法の準備 ....................................... - 30 -

4-2.POSデータの蓄積・データチェック等の加工・集計環境の整備 ............... - 30 -

4-3.POSのフォーマットの多様性 .................................................................... - 32 -

4-4.商品マスター・店舗マスターなどマスターデータの整備 ........................... - 33 -

4-5.運用体制の整備 .......................................................................................... - 34 -

Page 128: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

第1章.業務概要

1-1.目的

本業務は、経済産業省の「平成28年度IoT推進のため新産業モデル創出基盤整備事業(ビ

ッグデータを活用した新指標開発事業)」において、IoT推進のための新産業モデルの創出基盤

を整備するための 3つの事業のうち、「POSデータ及び関連するシステムによる実証実験」を行

います。

ここでは、小売事業者から POSデータを収集・加工・集計するシステムを用いて実際に POS

データの収集~提供までの一連のプロセスを実行し、小売事業者から経済産業省へ POSデータを

提出する枠組みを想定した場合の体制の整備や運用上の課題、対応策等を検討することを目的と

の洗い出しを目的としています。

1-2.方法

本業務は、次の 3つのステップで実証実験を進めます。

<ステップ1>

・複数の小売事業者から POSデータを収集する体制を整備するとともに、実際に小売事業者か

ら POSデータを収集し、統一されたフォーマットへの変換・集計を行うための仕組みを整備

します。

・具体的には、インテージグループにて開発・整備・運用している「PosPlatform(POSプラ

ットフォーム)」(以下、「PosPlatform」、という。)の仕組みを用い、POSデータには「イン

テージ SRI:全国小売店パネル調査」(以下、「インテージ SRI」、という。)にて収集してい

るデータを用います(POSデータの小売事業者名、店舗名は匿名データとして用います)。

・POSデータを収集・加工・集計し経済産業省に提出する体制の整備に関する課題・方向性に

検討に当たっては、POSデータの収集・加工・集計データの提供を行っている「インテージ

SRI」のサービスの仕組みをもとに、そこにおける運用実績等を把握し、検討することとし

ます。

<ステップ2>

・「PosPlatform」及び実際の POSデータを用い、4週間程度の期間において、POSデータの

収集・加工・集計の処理を行います。

・POSデータの収集・加工・集計処理は、日次単位で処理します。

<ステップ3>

・「PosPlatform」にて集計した日次集計データファイルを、毎日、経済産業省に提出する処理

を実施します。

Page 129: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

- 2 -

第2章.実証実験で利用する POS データ収集・集計体制の概要

本事業では、インテージの「インテージ SRI」及び「PosPlatform(POSプラットフォーム)」

の 2つの POSデータサービスのシステムを利用します。

それぞれのシステムの概要は、次のとおりです。

2-1.インテージ SRI の概要

全国の約 4,000店舗の小売店を対象に日々の POSデータを収集・集計しており、販売日、販売

場所(地域)、販売業態、商品分類・商品名、販売金額、販売個数について把握することができま

す。

対象としている業態は、スーパーマーケット(総合スーパーマーケット、食品スーパーマーケ

ット)、コンビニエンスストア、ホームセンター、ディスカウントストア、ドラッグストア、酒専

門店、ペットショップ、ベビー専門店などで、小売事業者を網羅的に把握しています。

対象とする店舗は、インテージが独自に整備している全国の小売事業者の母集団を把握するた

めの「店舗マスター」をもとに、業態、地域の代表性を担保できるようなサンプル設計を行い、

調査対象店舗を抽出し、小売事業者に依頼して POSデータを提供していただき、収集しています。

収集する POSデータについては、「一般財団法人流通システム開発センター」にて整備されて

いる「JANコード統合商品情報データベース」(JICFS/IFDB)をもとに、自社で付帯情報の付加

や JICFS/IFDBで把握されていない商品の情報を収集した、独自の「商品マスター」を整備・運

用し、POSデータの活用を行っています。

集計対象としている商品は、「食品(主食・加工食品・調味料等、生鮮品は除く)」、「飲料(清

涼飲料・アルコール)」、「日用雑貨品」、「化粧品」、「医薬品」、「タバコ」等です。独自の「商品マ

スター」及び「商品分類」に基づいた集計が可能となっています。

POSデータは日次で収集し、データのチェック及び「店舗マスター」、「商品マスター」との突

き合わせにより有効な集計データへ加工されます。集計は、「週次」及び「月次」を基本としてお

り、パネルデータとして有効となるように収集漏れやデータ欠測が多い店舗を除外した上で集計

しています。

Page 130: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

- 3 -

図表 2-1 「インテージ SRI」の概要

Page 131: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

- 4 -

2-2.PosPlatformの概要

「PosPlatform」は、POSデータののフォーマットが異なる複数の業態、複数の小売事業者の

POSデータを、目的に応じ、統一したフォーマットへの変換、集計を行うシステムです。

フォーマットの違い、POSデータの送信手法/タイミングの違いなども、一つひとつ統一された

システムに取り込めるような調整を行い、データの一元収集・一元管理が行います。

データのチェック基準や用いる商品マスターは、目的に応じて設定することができます。

図表 2-2 「PosPlatform」の処理フローイメージ

「PosPlatform」の処理の概要を示したものが図表 2-3です。

「PosPlatform」では、「インテージ SRI」と同様、多種多様な業態の小売事業者より POSデ

ータを収集することができます。収集した後のデータクリーニング、集計といった流れは「イン

テージ SRI」と基本的には同じです。異なるのは、「インテージ SRI」はそのサービスのルール・

基準に基づいてデータクリーニングやマスターとのマッチングが行われます。

一方、「PosPlatform」では、基本的には「PosPlatform」を利用して POSデータを収集・加工・

集計を行う主体の目的・基準等に基づいた処理が行われます。本実証実験の場合では、複数の小

売事業者から POSデータを収集し、経済産業省が求めるデータフォーマットに変換し、経済産業

省が決める基準でクリーニングを行い、経済産業省が求める集計フォーマットの集計データを作

成することとなります。

Page 132: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

- 5 -

図表 2-3 「PosPlatform」の収集~集計までのフレーム

クレンジング

レイアウト変換

ファイル取込

データ公開環境

小売P

OS

システム

EDI

POS

POS

POS

出蓄積

クリーニング

レイアウト変換

ファイル取込

POSデータ取込状況確認画面

POSデータのアップロード

POSデータのアップロード

小売事業者からの送付される POSデータは、自動的に取り込むか手動で取り込みを行います。

取り込みについては、小売事業者側の体制、環境、情報セキュリティポリシー等によって対応が

異なりますが、「PosPlatform」では柔軟に対応できるよう設計されています。

取り込まれた POSデータのレイアウトは小売事業者によって異なります。多様な業態、複数の

小売事業者の POSデータを加工、集計できるようにするためには、POSデータのフォーマット

を共通のフォーマットに変換する必要があります。変換には、多様な業態、複数の小売事業者の

POSデータフォーマットから共通項目を抽出することになります。

フォーマット変換され共通フォーマットの POSデータになった状態で、データクリーニングが

行われます。データクリーニングの基準は、利用主体、目的に応じて変更されます。クリーニン

グが終わったデータは集計用のデータとして蓄積され、目的に応じた集計が行われて公開・利用

されることになります。

Page 133: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

- 6 -

第3章.実証実験の概要及び実施結果

3-1.実証実験の概要

本実証実験では、小売事業者から POSデータの提供・収集を行い、一定の集計を行った上で経

済産業省に集計データを渡すところまでの一連のプロセスを実践します。

本実証実験では、大きく 2 つのプロセスを用意しており、①「インテージ SRI」での集計デー

タ作成、と、②小売事業者から直接提出を想定した集計データ作成、の 2 つのプロセスを実践し

ます。①及び②のプロセスの大きな違いは、①では「インテージ SRI」が対象としている約 4,000

店舗のデータを用い、「インテージ SRI」の基準でデータクリーニングが行われる処理を行うこと

であり、②では特定の業態(今回は「コンビニエンスストア」)に絞り、その業態に属するチェー

ンの複数店舗の POSデータを用いて日次集計の処理を行うことです。②については「インテージ

SRI」の基準とも異なり、本実証実験の独自の処理プロセスといえます。

図表 3-1 実証実験の全体概要

Page 134: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

- 7 -

3-2.「インテージ SRI」を用いた集計データの作成

(1)「インテージ SRI」を用いた集計データの作成フロー

「インテージ SRI」を用いた集計データの作成フローの特徴は、POSデータの収集は日次で行

い、データく設計された約 4,000店舗の POSデータを独自の基準でデータクリーニングを行った

上で、チェック済データを一定期間蓄積します。蓄積期間は、週次集計、月次集計に応じて異な

っており、集計対象となる基準も週次集計、月次集計によって異なります。

本実証実験では、「インテージ SRI」のデータをそのまま利用し、「インテージ SRI」の集計デ

ータとして 2016年 10月~11月の 2ヵ月(8週間)のデータを用い、データ処理中の処理工程の

履歴を確認します。また、時系列の変化を捉えるために前年同期に当たる 2015年 10月~11月の

集計データも参考で見るようにします。

図表 3-2 「インテージ SRI」を用いたデータ作成処理フローのイメージ

Page 135: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

- 8 -

(2)「インテージ SRI」の POSデータ処理工程

「インテージ SRI」では、小売事業者から POSデータを収集後、データの収集状況のチェック、

販売データとしてエラー等の除外チェックを行い、ローデータが作成されます。

その上で、様々な集計を行うための元となるデータとして集計用データが作成されます。

小売事業者からの POS データ収集は基本的には自動的に行われており、365 日 24 時間常時小

売事業者からの POSデータの送信、インテージ側での POSデータ収集が行われています。

収集した POSデータは、調査設計の店舗からの回収が行われているか、店舗別×販売日別の回

収状況チェック(集信状況チェック)が行われます。

対象店舗の POSデータと確認されれば、データクリーニングの処理(販売データチェック)が

行われます。データクリーニング処理は随時行われています。週次集計に間に合わす最短の処理

期間は、日曜日分のデータを翌月曜日に収集後、1 日後の火曜日までにデータクリーニングまで

が完了し、集計用のデータが作成されます。

集計データが全て揃ったところで、週次集計、月次集計が行われます。週次集計については、

集計用データが作成された火曜日の 2日後には、週次集計データを利用することができます。

図表 3-3 「インテージ SRI」の POS データ処理フロー

Page 136: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

- 9 -

①POSデータ収集の事前準備作業

POSデータを収集するためには、次にあげるような事前準備が必要となります。

1)必要となるデータ項目の確認

対象店舗から送付してもらう POSデータの項目を調整する必要があります。

2)データフォーマットの確認・調整

対象店舗から送付してもらう POSデータのフォーマットの確認が必要です。POSデータのフ

ォーマットは基本的に小売事業者ごと異なっています。今後、経済産業省にて「商業動態統計」

の代替手段として POSデータを収集する場合、小売事業者の POSデータフォーマットのまま収

集し、共通のフォーマットへ変換処理を行うことが必要になると考えられます。

3)データ送信/受取の方法の確認

小売事業者から POSデータを送信、受信者側で POSデータを受信するための方法について、

小売事業者との確認が必要です。

4)商品マスターの確認

収集する POSデータの商品範囲が広ければ、それだけ商品マスターの整備の範囲も広くなりま

す。商品マスターの整備は非常に手間がかかるものであり、目的に応じて収集する POSデータの

JANコードの種類、商品マスターの範囲を狭くする方が、運用上の負荷を低減することができま

す。

5)店舗マスターの確認

小売事業者から収集する POSデータには、チェーン及び店舗の識別情報もコード化されていま

す。個別の店舗について特性が必要ないとしても、どの地域の店舗かを識別するには、基本的に

は個別の店舗を特定できるような、住所情報等を持つ店舗マスターが必要となります。

店舗の開店・閉店も頻繁に生じることから、店舗マスターについても定期的なメンテナンスが

必要です。

6)サーバの準備

小売事業者から収集する POSデータの項目、フォーマット、商品分野を特定するとともに、対

象となるチェーン、店舗の規模に応じて POSデータ、加工後のデータ容量などの推計を行った上

で、サーバのスペックを設定し準備する必要があります。

Page 137: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

- 10 -

②POSデータ収集時のデータチェック作業

小売事業者からの POSデータの送信有無(受信有無)の確認を行います。「インテージ SRI」

では調査対象として設計されたチェーン、店舗の POSデータが収集できているかを確認します。

集信状況はシステム的にリスト化され、オペレーターによる監視活動を行うとともに、小売事

業者ごとの集信状況リストの作成し、必要に応じて督促等を行います。

「インテージ SRI」での受信データのデータ件数は、1日当り約 1,200万件となります。

③POSデータ収集後のデータチェック作業

1)店舗全体のデータ

開店・閉店前セールの異常データ、システムエラーによる異常データといった異常値と思われ

るデータを検出します。

可能であれば店舗側に疑義照会を行い、必要に応じてデータ修正を行います。

2)SKU変換チェック

SKU(Stock Keeping Unit)コードとは、同じ JANコードの商品でも「梱包個数が異なる」、

「色が異なる」などで在庫管理等で、JANコードとは別に付与しているコードとなります。例え

ば、受信した POSデータに、ある商品の 6個入りの SKUコード認識で識別したが、価格等が合

わないなど実際の販売と異なる SKUコードでの送信がないかチェックします。状況に応じて、

商品情報を補足し、コード変換処理を実施して修正します。

3)単価上下限エラーチェック

商品ごとに単価が高すぎる、低すぎるデータをチェックしています。

商品ごとに単価上限・下限値を設定しており、設定値を超えた単価が出現している場合、異常

値と判断し、店舗問合せ等で確認を行っています。

4)異常店チェック

一日客数、販売個数計、販売金額計など過去の同時期データと比べ極端に大きい、小さいとい

ったデータを自動的に抽出しています。改装、閉店、システムトラブルなど要因が無いかを個別

に調査し、店舗問合せ等で確認を行っています。

5)大量販売チェック

店舗別×SKU単位で過去データと比べて極端に販売個数、金額が大きいデータを自動的に抽出

しています。業者による大量発注は、「インテージ SRI」の目的と異なるためデータ除外していま

す。また、システムエラーの場合もデータを除外しています。

Page 138: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

- 11 -

6)商品マスターチェック

JANコードの有効期間外のデータの有無をチェックしています。

1)~6)のデータチェックを行った際の、除外したデータ件数の発生状況を示したのが図表 3

-4です。

異常値等で削除されるデータが、要検査対象データ件数の約 3%程度となっています。

図表 3-4 「インテージ SRI」のデータ処理における削除データ件数

※異常値等システムチェック削除:システム処理により一定の基準で自動的に除外処理する件数

※大量販売等人的チェック削除:システム処理により異常値と判定されたデータのうち、人的なチ

ェック及び追加調査・疑義照会等により除外処理する件数

※商品マスターエラー削除:商品マスターとのアンマッチにより除外される件数

Page 139: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

- 12 -

(3)「インテージ SRI」の POSデータ処理体制

①ハード等の物理的環境

以下のスペックのサーバで運用しています。

サーバ構成 マスタサーバー:1台(スタンバイ 1台)

(データ処理・集計の管理サーバ)

セグメントサーバー:16台

(各種データ処理・集計・データ保存等の処理サーバ、マスターサ

ーバ管理のもと各種処理を分散して実施、多種の処理が同時並行で

可能)

1台当りスペック 物理コア数:16(論理コア数:32)

メモリ:64GB

ストレージ(データ領域) マスタサーバー:151GB

セグメントサーバー:2.8TB(ミラー部分も合わせると+2.8T)

②人員体制

「インテージ SRI」の運用として、25人の専門スタッフが対応しています。

③処理時間等

データチェック工程の運用では、毎日 4人が半日程度(2~3時間)の作業を実施。基本的には、

システムによるチェック結果の運用確認を行う作業になります。

システムによるデータチェックのうえで、目視による最終確認等が必要な場合は、社員による

確認作業を実施しています。場合によっては店舗側への確認作業も発生するため、工数がかかる

場合もあります。

Page 140: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

- 13 -

(4)商品マスターの整備

①商品マスターの整備状況

インテージでは、「インテージ SRI」での利用のほか、消費者パネルデータ(インテージ SCI)

での利用も兼ねて、商品マスターの整備を行っている。

一般財団法人 流通システム開発センターで整備している「JAN コード統合商品情報データベ

ース(JICFS/IFDB)」をベースに、そこに含まれていないプライベートブランド(PB)、地域限

定商品(日配品)等の商品を独自に収集し、JANコードを整備しています。

2016年 10月時点で有効である、1,080,105品目の JANコードを整備しています。

そのうち、JICFS 登録品目は 593,693 品目(55.0%)、独自に整備している品目が 486,412 品

目(45.0%)となります。

図表 3-5 インテージの商品マスター件数(2016年 10 月時点)

Page 141: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

- 14 -

②商品マスターの整備方法

「インテージ SRI」の対象店舗から送られてくる POSデータに含まれる JANコード、消費者

パネル調査(インテージ SCI)のモニター5万人からの送られる購買情報の JANコード、メーカ

ーからの提供情報など、様々な情報をもとに新製品等を把握し、ホームページや現品確認よる情

報収集を行い、マスターを整備しています。

③商品マスターの整備体制

商品マスター登録を専門としたスタッフ 約 90名体制の組織で運用しています。

商品マスターの更新は毎週及び月末に行っており、週次集計、月次集計に最新の商品マスター

を用いるようにしています。

Page 142: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

- 15 -

(5)「インテージ SRI」の集計結果

「インテージ SRI」の 2015年 10月~11月、2016年 10月~11月の店舗からの収集した POS

データより、販売金額について積上げた実績値を業態別にみたものが図表 3-6、インテージが独

自に推計した母集団月商に基づいて拡大推計したものが図表 3-7です。

販売金額では、実績値、拡大推計値ともに「スーパーマーケット」が最も多い金額となってい

ます。拡大推計については、スーパーマーケットよりもコンビニエンスストア、ドラッグストア

でより大きく拡大されていることがわかります。

図表 3-6 「インテージ SRI」の業態別実績値

(出典)インテージ SRI( 2015年 10月~11月、2016年 10月~11月)集計店当り販売金額

図表 3-7 「インテージ SRI」の業態別拡大推計値

(出典)インテージ SRI( 2015年 10月~11月、2016年 10月~11月)集計店当り販売金額

Page 143: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

- 16 -

「商業動態統計」の統計値に対するインテージ SRI(実績値)の割合を見ると、「スーパーマー

ケット」は 14%前後、「コンビニエンスストア」は 0.9%前後、「ドラッグストア」は 4%前後、「ホ

ームセンター」は 13%前後を占めていることがわかります。

「インテージ SRI」で最も多く収集している「スーパーマーケット」でも、「商業動態統計」の

14%程度、「コンビニエンスストア」は「ドラッグストア」については 1~4%程度であり、今後、

小売事業者の多くから POSデータを収集する場合、単純に「インテージ SRI」と比べても非常に

多くの規模の体制で運用する必要があると思われます。

図表 3-8 「商業動態統計」に対する「インテージ SRI」の業態別実績値の割合

Page 144: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

- 17 -

3-3.小売事業者から POSデータの直接提出を想定しプロセスの実践

(1)小売事業者から POSデータを直接提出するプロセスの概要

インテージにて収集している POSデータのうち、コンビニエンスストアに属する約 1,000店舗

の POSデータを利用します。

本実証実験では、チェーン別×店舗別×JANコード別×日別の販売金額、販売個数の集計を行

います。

集信した POSデータは、データクリーニングを行いますが、基本的には集計不可な異常データ

(チェーン不明、店舗不明(店舗マスターのアンマッチ)、販売金額・個数不明)のみ除外します。

JANコードについては「インテージ SRI」の商品マスターを用いるため、商品マスターとのアン

マッチは全て「不明」とします。

チェック済データは、「インテージ SRI」のように蓄積せず日次で集計します。

販売日の 1日後に POSデータを集信し、2日後にデータチェック及び集計処理を行い、3日後

には集計データを経済産業省に提出します。

本実証実験では、平成 28年 12 月 5日~平成 29年 1 月 2 日分の販売データを用いて集計を行

います。

図表 3-9 小売事業者から POSデータを直接提出するプロセスのイメージ

Page 145: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

- 18 -

(2)実証実験の具体的要件

①対象業態・チェーン及び店舗数

コンビニエスストアの 4チェーン・約 1,000店舗の POSデータを利用します(実際の収集店舗

数とは異なります)。

Aチェーン:445店

Bチェーン:711店

Cチェーン:199店

Dチェーン:275店

計:1,630店 ※チェーン提供店舗マスター件数

②対象期間・処理スケジュール

2016年 12月 5日~2017年 1月 2日(29日間)の受信データを集計しています。

集計サイクルとしては、受信翌日にデータ集計開始、受信 4 日後午前に集計結果を経済産業省

に提供します(処理としては受信後 2日間で実施しており、3 日後に提供することも可能です)。

実証期間中は、これらの処理は全て自動処理で実施します。

実証実験期間中、小売事業者からの送信エラー等が発生したことを想定し、一部チェーンの受

信分の処理を 1 日保留させるイレギュラーな運用を実施しました(C チェーンにおける 12 月 18

日販売分のデータについて、受信はするものの処理を保留し、12 月 19 日販売分のデータと合わ

せて処理を行ないました。)。

③加工・集計方法

集計は、販売日別×チェーン別×店舗別×JANコード別、に処理しています。

データレイアウトは、20ページの図表 3-11を参照してください。

受信した POS データをそのまま利用しており、「インテージ SRI」で実施しているような異常

値の除外についてはここでは行っていません。

インテージ商品マスターに無い商品は、「不明」として処理しています。

Page 146: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

- 19 -

(3)POSデータの統一フォーマット

本実証実験で、4チェーンから収集した異なる POSデータをフォーマットは、図表 3-11に示

す統一フォーマットに変換しています。

フォーマットの変換では、4チェーンの共通項目として、店舗コード、JANコード、販売金額、

販売個数などを用い、その他、「商業動態統計」のデータに近くなるように、チェーン名、店舗名

などのテキスト情報をマスターから付与するイメージでダミーデータを付与しています。

図表 3-10 POS データの統一フォーマット

マスタとマッチング マスタとアンマッチ

1 代理提出機関法人番号 代理提出機関の法人番号 固定値「3010001152563」 同左

2 代理提出機関名 代理提出機関の法人名 固定値「(株)インテージ」 同左

3 法人番号 申告者の法人番号(http://www.houjin-bangou.nta.go.jp/) チェーンコード(4桁)+固定値「000000000」(9桁) 同左

4 法人名 申告者の法人名 マスキングチェーン名称 同左

5 政府統計コード政府統計一覧の番号(http://www.e-stat.go.jp/estat/html/tokei_itiran.pdf)

固定値「00550030」 同左

6 統計調査番号 経済産業省調査統計システム(略称STATS)で管理する番号 固定値「A03」 同左

7 調査票番号 調査票に記載されている番号 固定値「0004」※丁1調査票(コンビニエンスストア用) 同左

8 調査票番号枝番 商動固有の対象を予め業種格付けするための番号 固定値「230」※23 飲食料品小売業 同左

9 事業所・企業番号 経済産業省が指定する事業所番号10桁 マスキング店舗コードマスキング店舗コードまたはTEMPxxxxxx※1

10 事業所・企業名 マスキング店舗名称空白または「店舗」+POS店舗コード※1

11 分類番号調査票に記載されている番号(代理提出機関の管理する業態及び大中小分類に従って番号を変更する)

固定値「0101」 同左

12 分類番号枝番現行の品目分類を細分化するコード(代理提出機関の管理する業態及び大中小分類に従って番号を変更する)

固定値「01」 同左

13 アイテム番号 調査票に記載されているアイテム番号 固定値「A」 同左

14 売上年月日 POSデータの売上年月日(YYYYMMDD) 売上年月日 YYYYMMDD 同左

15 チェーンコード 代理提出機関管理のチェーンコード。左詰め可変長。 チェーンコード 同左

16 チェーン名 代理提出機関管理のチェーン名 マスキングチェーン名称 同左

17 店舗コード 代理提出機関管理の店舗コード。左詰め可変長。 マスキング店舗コードマスキング店舗コードまたはTEMPxxxxxx※1

18 店舗名 代理提出機関管理の店舗名 マスキング店舗名称空白または「店舗」+POS店舗コード※1

19 都道府県コード 統計に用いる標準地域コード、ただし、インターネット販売は99を利用 都道府県コード 空白

20 都道府県名称 都道府県名称 空白

21 大分類コード 代理提出機関管理の大分類コード。左詰め可変長。 大分類コード 左詰め可変長 固定値「2147483647」

22 大分類名称 代理提出機関管理の大分類名称 大分類名称 固定値「不明」

23 中分類コード 代理提出機関管理の中分類コード。左詰め可変長。 中分類コード 左詰め可変長 固定値「2147483647」

24 中分類名称 代理提出機関管理の中分類名称 中分類名称 固定値「不明」

25 小分類コード 代理提出機関管理の小分類コード。左詰め可変長。 品目コード 左詰め可変長 固定値「2147483647」

26 小分類名称 代理提出機関管理の小分類名称 品目名称 固定値「不明」

27 商品コード JANコードなど商品コード UPC変換済商品コード 同左

28 商品名 商品の名称 インテージマスタの商品名称※2 固定値「不明」

29 販売数量 整数。POSデータに販売金額のみ存在する場合はブランク。販売数量数量が存在しない場合は空白

同左

30 数量単位 重量、数量の単位を記載。 固定値「個」 同左

31 販売金額 整数。POSデータに販売数量のみ存在する場合はブランク。販売金額金額が存在しない場合は空白

同左

32 消費税 販売時点の消費税率 固定値「08.00」 同左

設定内容No 項目名称 内容

Page 147: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

- 20 -

(4)処理結果

①収集店舗数の推移

設計段階では、4チェーンで 1,630店舗マスターを用意していましたが、実際、実証実験期間

中に収集したデータは、1,036店舗でした。(販売日 2016年 12月 5日(月)~2017年 1日 2日

(月)の実績)。

店舗マスター登録数と、実際に POSデータを収集した店舗数の乖離の要因は、店舗マスター登

録後の閉店・開店等が要因と思われます。

店舗別の収集状況を確認すると、日によって収集できていない店舗もありました。(要因は、小

売り側の送信遅れ、システムトラブルなど外的要因が考えられます。「インテージ SRI」では月次

データ提供を受けており、月次データでは全店把握)。

図表 3-11 収集店舗数の推移

(店)

販売日 2016/12/5 2016/12/6 2016/12/7 2016/12/8 2016/12/9 2016/12/10 2016/12/11 2016/12/12 2016/12/13 2016/12/14 2016/12/15 2016/12/16 2016/12/17 2016/12/18 2016/12/19

合計 1,030 1,033 1,031 1,033 1,032 1,012 1,009 1,031 1,032 1,031 1,033 1,032 1,013 1,011 1,029

チェーンA 384 385 385 385 385 385 385 385 385 385 385 384 384 384 384

チェーンB 409 411 409 411 410 390 387 409 410 409 411 411 392 390 408

チェーンC 103 103 103 103 103 103 103 103 103 103 103 103 103 103 103

チェーンD 134 134 134 134 134 134 134 134 134 134 134 134 134 134 134

販売日 2016/12/20 2016/12/21 2016/12/22 2016/12/23 2016/12/24 2016/12/25 2016/12/26 2016/12/27 2016/12/28 2016/12/29 2016/12/30 2016/12/31 2017/1/1 2017/1/2 日平均

合計 1,033 1,033 1,032 1,013 1,010 1,009 1,026 1,025 1,022 1,005 998 996 987 988 1,020

チェーンA 384 384 384 384 384 384 384 384 384 384 384 384 384 381 384

チェーンB 412 412 412 393 390 389 407 406 403 386 379 377 370 374 399

チェーンC 103 103 103 103 103 103 102 102 102 102 102 102 102 102 103

チェーンD 134 134 133 133 133 133 133 133 133 133 133 133 131 131 133

Page 148: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

- 21 -

②データレコード件数の推移

チェーン・店舗別×販売日別×JANコード別に集計処理したデータレコード件数は、1日当り

約 84万~約 96万レコードで推移しています。平均すると 1日当り平均で 915,558レコードのデ

ータ件数でした。

平日の月曜から金曜にかけてデータ件数は徐々に増加、土日祝日にレコードデータ件数は減少

する傾向が見られます。

今回の集計は、JANコード単位で集計しているため、レコード件数は、各チェーン及び各店舗

において取り扱われており、かつ、販売された商品・サービスの種類によって変動する。

1店舗当たりでは、1日平均 894件。チェーンによって異なり、Aチェーンで 967件、チェー

ン Cで 810件と、150件ほどの差が見られる。チェーン Aについては、同一販売日のデータが 2

日間に渡って受信されており、一部店舗(数店舗)について 1日目の送信時点で未送信の状況で

した。2日目のデータ受信によって同一販売日のデータが全て揃う形になり、他の 3チェーンに

比べ同一販売日データが揃うのが 1日遅れています。また、重複していることからデータ件数も

多くなっています。

今回の実証実験では、実証実験期間中、収集した日別にデータを集計処理しており、データ内

の店舗及び販売日の重複チェックまでは行っていませんでした。そのため、チェーン Aは多くの

店舗で重複が発生しています。(「インテージ SRI」では一定期間、データを蓄積して集計する場

合は、事前に重複チェックされ除外されています。日次処理の場合は、別途、店舗マスター別に

集計履歴を残す必要があります)。

Page 149: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

- 22 -

図表 3-12 総データレコード件数の推移

土日 土日 祝日・土日 年末年始休み

図表 3-13 チェーン別データレコード件数の推移

土日 土日 祝日・土日 年末年始休み

図表 3-14 チェーン別 1 店舗当りデータレコード件数の推移

土日 土日 祝日・土日 年末年始休み

Page 150: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

- 23 -

③データ容量の推移

チェーン・店舗別×販売日別×JANコード別に集計処理したデータファイル容量は、4チェー

ン・約 1,036店舗合計で 1日平均約 216,540KBでした。チェーン別では、店舗数や取扱・販売商

品数によってデータ容量が異なっています。

1店舗当たりでは、1日平均 212KBでした(183~217KBで推移)。チェーンによって異なり、

Aチェーンで 226KBと最も大きく、チェーン Dで 195KBと最も小さいという状況です。

図表 3-15 総データ容量の推移

図表 3-16 チェーン別データ容量の推移

土日 祝日・土日土日 年末年始休み

Page 151: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

- 24 -

図表 3-17 チェーン別 1 店舗当りデータ容量の推移

土日祝日・土日土日 年末年始休み

Page 152: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

- 25 -

④総販売額の推移

チェーン・店舗別×販売日別に集計処理した販売金額は、4チェーンの 1日平均合計で 47,567

万円でした。

1店舗当たり日平均販売金額は、4チェーン平均で 465,435円。チェーン別では、Aチェーン

が 483,893円と最も多く、次いで Bチェーンが 474,010円、チェーン Cが 426,899円、Dチェ

ーンが 416,234円となっています。

図表 3-18 総販売額の推移

土日 土日 祝日・土日 年末年始休み

図表 3-19 チェーン別総販売額の推移

土日 土日 祝日・土日 年末年始休み

Page 153: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

- 26 -

図表 3-20 チェーン別 1 店舗当り総販売額の推移

土日 土日 祝日・土日 年末年始休み

⑤商品分類別のレコード件数及び総販売額

商品分類別(インテージ商品分類・大分類別)×販売日別に、データレコード件数、販売金額

を集計しました。商品分類には、インテージの商品マスターを用いており、商品マスターになり

商品等については「不明」として集計しています。

商品分類別(大分類別)に見ると、販売金額では、「タバコ(21.7%)」、「アルコール(16.1%)」、

「清涼飲料(14.3%)」が上位を占めている。レコード件数では、「アルコール(33.5%)」、「清涼

飲料(19.1%)」 、「タバコ(9.2%)」が上位を占めています。

販売金額、レコード件数とも「不明」が最も多くを占めており、販売金額の 4割以上、レコー

ド件数の 3割以上を占めています。これは、今回収集した POSデータのうち約 3割の商品等が不

明ということを示しています。

図表 3-21 商品分類別のレコード件数構成比

Page 154: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

- 27 -

図表 3-22 商品分類別の総販売額構成比

Page 155: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

- 28 -

⑥販売金額についての考察

本実証実験で、実際に POSデータ収集された店舗は、1,036店舗でした( 12月 5日(月)~

31日(月)のデータから算出)。

集計した POSデータの、1日・1店舗当りの平均販売金額は 465,435円でした。2016年 12月

の 1ヵ月(31日)換算する 14,428,476円となります。

「商業動態統計調査」2016年(平成 28年)12月のコンビニエンスストアの商品販売額は、

947,075(百万円)、月末店舗数は 55,636店でした。1店舗当りの商品販売額は 17,022,701円と

なります。

本実証実験から試算した 1店舗当りの販売金額(14,428,476円)は、「商業動態統計調査」か

ら算出した 1店舗当たりの商品販売額(17,022,701円)の 84.8%にあたる金額になります。

本実証実験で収集した POSデータは、「商業動態統計調査」で捉えている商品販売金額の 8割

以上を把握するものでした。

図表 3-23 2016 年 12 月のコンビニエンスストアの販売金額に関する

実証実験と「商業動態統計調査」との比較

1店舗1日当たり平均販売額(円) 465,435 a)

1店舗1ヵ月当り平均販売額(円)(推計) 14,428,476 b)=a)×31

コンビニエンスストア平均店舗売上高に対する割合 84.8% c)=b)/z)

商業動態統計調査・コンビニエンスストア商品販売額(百万円) 947,075 x)

コンビニエンスストア店舗数 55,636 y)

1店舗当たりコンビニエンスストア商品販売額(円) 17,022,701 z)=x/y

(出典)経済産業省「商業動態統計調査」2016年 12月

Page 156: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

- 29 -

⑥「PosPlatform」を用いた実証実験の処理体制

1)ハード等の物理的環境

以下のスペックのサーバで運用しています。

サーバ構成 データ処理サーバ(物理サーバ)

集計処理サーバ(仮想サーバ)

1台当りスペック (データ処理サーバ):CPU4コア、メモリ:128GB、HDD:3.6TB

(集計処理サーバ):CPU2コア、メモリ:4GB、HDD:320GB

ストレージ(データ領域) マスタサーバー:151GB

セグメントサーバー:2.8TB(ミラー部分も合わせると+2.8T)

2)人員体制

本実証実験では、処理作業者、確認者の 2名の体制で実施。

初期設定作業等は、さらに人員を追加して実施。

3)処理時間等

準備段階では、小売事業者ごとに POSデータレイアウト確認、変換プログラムの作成、テスト、

店舗マスターの設定・確認、各種設定等作業が必要でした。1小売事業者当り 3人日程度の作業

内容でした。

実際のデータ処理時間は、今回の実証実験(4チェーン、約 1,000店舗)では、次のとおりで

す。

データ受信・チェック・保存:3分/日

データ変換処理 :18分/日

集計データ作成処理 :38分/日

Page 157: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

- 30 -

第4章.小売事業者から POS データを収集する体制構築に向けた

考察

4-1.小売事業者からの POSデータの提供方法の準備

(1)課題

経済産業省にて多くの小売事業者から日次など定期的かつ高頻度で POSデータを提供しても

らうための環境整備が必要です。

企業規模や現時点での ICT導入状況など、小売事業者側の様々な状況が想定されます。

(2)対応

日次など高頻度で POSデータを提供してもらうには、EDI(Electronic Data Interchange)環

境を用意し、小売事業者からオンラインで提出してもらうような環境構築が必要です。EDIにつ

いては、標準的なものの検討も考えられますが、基本的には小売事業者のフォーマットと環境に

応じ、個別に対応する必要が生じる可能性があります。

また、別の提出方法(データアップロード)や、従来どおり調査用紙への自記入式の手法も残

すなど、多様なデータ提出環境を用意する必要性も考えられます。

4-2.POSデータの蓄積・データチェック等の加工・集計環境の整備

(1)課題

小売事業者の POSデータは、粒度を細かくすればするほどデータ量は膨大になります。また、

収集したローデータから、データチェックや各種マスターからデータを付与するなど加工データ、

必要な様式で集計した集計データなど多様なデータが作成されます。これら膨大なデータを適切

にかつ安全に保管・管理する環境が必要です。

本実証実験では、インテージ SRIの約 4,000店舗のデータ、「PosPlatform」を用いたコンビニ

エンスストア約 1,000店舗のデータを処理しました。

「商業動態統計調査」で把握している店舗数は、スーパーマーケットでは今回の処理件数の約

5倍、コンビニエンスストアでは約 73倍、ホームセンターで約 21倍、ドラッグストアで約 13

倍となります。

インテージが独自に推計した母集団店舗数は、スーパーマーケットでは今回の処理件数の約 25

倍、コンビニエンスストアでは約 75倍、ホームセンターで約 27倍、ドラッグストアで約 46倍

となります。

Page 158: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

- 31 -

表 4-1 「商業動態統計調査」店舗数とインテージ SRI の設計店舗数

商業動態統計調査

(2016年12月)

店舗数

インテージSRI

設計店舗数

商業動態統計調査

店舗数÷設計数

合計 79,179 3,153 25.1

 スーパーマーケット計 5,080 1,119 4.5

コンビニエンスストア 55,636 762 73.0

ホームセンター/ディスカウントストア 4,273 200 21.4

ドラッグストア 14,190 1,072 13.2

※「商業動態統計調査」と「インテージ SRI」の業態定義は異なっていることに注意。

※上記表のうち「商業動態統計調査」の「スーパーマーケット」は百貨店も含む数値。また、「ホー

ムセンター/ディスカウントストア」はディスカウトストアを含まない数値。

(出典)経済産業省「商業動態統計調査」2016年 12月

表 4-21 インテージ SRI の設計店舗数と推計母集団店舗数

(2)対応

小売事業者が従来は公開していない POSデータを収集することから、機密性に十分に配慮した

データ蓄積環境が必要です。

店舗数は、必要となる母集団数を想定し、収集体制の構築が必要です。

データ量は日々増えていくことから、クラウド環境などの利用も想定されますが、セキュリテ

ィも十分考慮した環境設計が必要です。

Page 159: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

- 32 -

4-3.POSのフォーマットの多様性

(1)課題

小売事業者の POSデータのフォーマットは各社多様です。

(2)対応

経済産業省で必要なデータ項目のみを整理し、それに合わせて調整したデータを小売事業者側

に作成させ提出させることも考えられます。ただし、小売事業者側の負担(システム的な改修)

も生じることから、POSデータの提出率が低下する恐れがあります。

基本的には、小売事業者が提出する POSデータのフォーマットを事前に確認し、そのフォーマ

ットでデータを受信し、経済産業省にて必要な項目のみ利用するような対応が望ましいと思われ

ます。そのためも、フォーマット対応準備が必要となります。

Page 160: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

- 33 -

4-4.商品マスター・店舗マスターなどマスターデータの整備

(1)課題

POSデータには JANコードや小売事業者独自のインストアコードが付与されており、POSデ

ータそのままでは商品カテゴリーの特定が難しいといえます。

商品と同様に、店舗等もコード化されており、小売事業者ごとにどの店舗か判別しなければ、

エリアの特定なども難しくなります。

(2)対応

各社共通となる JANコードについては、小売事業者で取り扱っている全品目の JANコードを

マスターとして整備することが望ましいといえます。また、日次でデータを収集し、日次・週次・

月次などのタイミングで集計するのであれば、マスターは常時、最新のものとなるような維持・

管理が必要となります。

生鮮品やサービス類など各小売事業者で独自に付与しているインストアコードについては、共

通化が非常に難しいものです。各社の商品コードを収集し、経済産業省にて共通コードに置き換

える必要があります。

店舗マスターも店舗開店・閉店等の情報を常時収集し、最新のものとなるような維持・管理が

必要となります。

Page 161: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

- 34 -

4-5.運用体制の整備

(1)課題

POSデータの収集、データのクリーニング(チェック)、集計データの作成までシステム化が

され自動的な処理ができますが、システムの運用要員、データチェックの目視確認(場合によっ

ては疑義照会)、集計データの目視確認、といった人的要員が必要となります。

(2)対応

体制としては、小売事業者からのデータの提出・受信の「集信」に関する小売事業者との対応・

問合せ窓口、データの受信・加工・集計といったシステム的な処理プロセスを担当し運用する組

織(システム的なスキル、システムでは処理できない人的チェック・加工に対応するスキル)、商

品マスターや店舗マスターの維持・整備を担当する組織、といった体制が必要になります。

システム、人員的にも大規模な体制が想定されます。

体制の構築及び運用に当たっては、民間ノウハウを活用することも想定されます。

Page 162: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

Copyright © 2017 Nomura

This document is the sole property of Nomura. No part of this document may be reproduced in any form or by any means – electronic, mechanical, photocopying, recording or otherwise – without the prior written permission of Nomura.

1

ビッグデータを活用した新指標の開発

本報告書は経済産業省の平成28年度「IoT推進のための新産業モデル創出

基盤整備事業(ビッグデータを活用した新指標開発事業)」の一環として作成

されたものである。

野村證券 株式会社

金融工学研究センター/

経済調査部

2017 年 3 月 31 日

Page 163: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

2

目次

1. 既存の経済統計指標を代替・補完する新指標の開発・評価 ...................................................................................... 3

1.1 Summary .................................................................................................................................................... 3

1.2 分析手順 ..................................................................................................................................................... 3

1.3 ワード探索 ................................................................................................................................................... 4

1.3.1 ターゲットマクロ指標と他のマクロ指標との相関 ............................................................................... 4

1.3.2 ターゲットマクロ指標とキーワードを含むブログ件数の相関 .............................................................. 5

1.4 AI によるツイートの選別 ............................................................................................................................... 8

1.4.1 残業ツイート選別 AI 作成手順の概要 ............................................................................................. 8

1.4.2 モデル学習データに関して ........................................................................................................... 11

1.5 IIP 推定時系列モデルの作成 ..................................................................................................................... 11

1.5.1 製造工業生産予測指数を用いた IIP 予測モデル(ベンチマーク) ..................................................... 12

1.5.2 SNS を利用した IIP 予測モデル .................................................................................................... 12

1.5.3 参考: SNS のみを用いて作成した場合のグラフ ............................................................................. 15

1.5.4 重回帰モデル作成時の注意点 ..................................................................................................... 17

2. 地域の経済活動を表す指標算出のための新手法の研究・開発 ............................................................................... 18

2.1 Summary .................................................................................................................................................. 18

2.2 分析手順 ................................................................................................................................................... 18

2.3 景気に関するツイートの抽出 ...................................................................................................................... 19

2.4 抽出したツイートのセンチメント評価 ............................................................................................................ 20

2.5 指数の算出 ................................................................................................................................................ 22

2.6 地域化に関する考察 .................................................................................................................................. 22

2.7 今後の課題と社会への応用に関する考察 ................................................................................................... 24

3. 中小企業における景況感を表す指標の研究・開発 ................................................................................................. 25

3.1 Summary .................................................................................................................................................. 25

3.2 分析手順 ................................................................................................................................................... 25

3.3 中小企業景気に関するツイートの抽出 ........................................................................................................ 26

3.4 抽出したツイートのセンチメント評価 ............................................................................................................ 28

3.5 指数の算出 ................................................................................................................................................ 28

3.5.1 得られた指数と中小企業業況判断 DI の相関 ................................................................................ 30

3.5.2 時系列モデルの作成: 中小景況 Tweet 指数 ................................................................................. 33

4. 指標の安定的な公表に向けたプロトタイプの開発 ................................................................................................... 37

4.1 Summary .................................................................................................................................................. 37

4.2 API による Twitter データの収集 ................................................................................................................. 38

4.2.1 Streaming API ............................................................................................................................ 38

4.2.2 REST API ................................................................................................................................... 39

4.3 ブログデータの追加を検証 ......................................................................................................................... 40

4.4 Streaming API を用いることの影響 ............................................................................................................ 42

4.5 自動計算システムの開発と課題 ................................................................................................................. 45

5. 参考文献 .............................................................................................................................................................. 47

Page 164: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

3

1. 既存の経済統計指標を代替・補完する新指標の開発・評価

1.1 Summary

Twitterおよびブログから得られた指標を用いて、鉱工業指数、商業動態統計、第 3次産業活動指数、

新車登録台数の 4つのマクロ指標(以下、ターゲットマクロ指標)を推定するモデルを開発した。

Twitterやブログは主に月次の件数を指標として用いたが、意味のあるツイートかそうでないかを自動で

判定するなど、AI技術を活用することで精度を向上させる取り組みを行った。例えば、鉱工業生産指数

は”残業”というキーワードを含むツイートとの相関が高いが、これは製造業の生産量と労働者の労働時間

が相関を持つためと考えられる。そこで、残業を含むツイートの内、“今日も残業だった”等の残業したこと

を意味するツイートのみを抽出し、“今日は残業しなかった”等のツイートを除く AIを開発した。

Twitterやブログの件数を抽出するキーワードを網羅的に探索するために、約 200個のキーワードと各

ターゲットマクロ指標の相関を算出し、それぞれのターゲットマクロ指標を推定するためのワードを探索し

た。

上記のようにして得られた Twitterおよびブログ指標に株価指数や為替の系列も加えて、マルチファクタ

ーで鉱工業生産指数(以下、IIP)を推定する時系列モデルを作成した。Twitterやブログ指標はその他

の指標と併せても高い t値を示し、Twitterやブログを使わない場合と比較して高い精度で鉱工業生産

指数を推定出来ることを確認した。

得られた IIPの推定値は日次で更新可能な指数であり、IIPの速報値や製造工業生産予測指数と比較

しても速報性が高く、より迅速な政策決定や投資指標としての活用が期待される。

また、速報性だけでなく、精度の面でも IIPの予測に広く用いられている製造工業生産予測指数と比較

しても自由度調整済決定係数で大きく上回っており、IIPの予測を精度と速度の両面で改善できる可能

性がある。

開発した鉱工業生産指数(IIP)の推定モデル

注) 本図表は 15 ページの図表 20 を転載した。

出所) 野村證券

1.2 分析手順

分析は以下の手順で行った。

1. ワード探索

80

85

90

95

100

105

110

115

2008/12 2009/12 2010/12 2011/12 2012/12 2013/12 2014/12 2015/12

IIP(2008年12月

を100に

基準

化)

IIP実績値

製造工業生産予測指数のみ利用したモデル

SNSを利用したモデル

Page 165: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

4

– マクロ指標と関連が強いと考えられる約 200のキーワードを選定し、ブログデータを用いてワー

ドと統計指標の相関を計測。

– 例: 「残業」を含むブログ件数と鉱工業生産指数は高い相関。

2. AIによる選別

– 得られた有望ワードを含む文書の中身のテキストを解析。以降はツイートを用いる。

– AIによって、ワードを含むものの無関係のツイートを除き、意味のあるツイートだけの件数を得

る。

– 例: 残業を含むツイートから実際に残業したことを意味するツイートを抽出。

3. 統計指標推定モデルの作成

– 文書解析を行って得られた値を用いて、統計指標をリプリケイトする時系列モデルを作成。

1.3 ワード探索

約 200個のキーワードを含むブログ件数を月毎に集計し、マクロ指標との相関を計測した。

1.3.1 ターゲットマクロ指標と他のマクロ指標との相関

キーワードの選出に先立ち、推定目標となるターゲットマクロ指標と相関の高いマクロ指標を探索した。相

関を算出した約 80個のマクロ指標の一覧は Appendix A.1に示した。図表 1-図表 4 は各ターゲット指

標と相関(前月比)の高かったマクロ指標の上位 10である。例えば、図表 1からは鉱工業生産指数(IIP)

が所定外給与との相関が高いことが分かり、これによって残業や仕事に関するキーワードが有効であると

類推される。また、商業動態統計や第 3次産業活動指数は訪日外客、Cカード業(クレジットカード)、コン

ビニ販売額等が上位に挙がっており、旅行や買い物したことを表すキーワードが有効と推察される。

図表 1: 鉱工業生産指数とマクロ統計の相関(上位 10)

出所) 野村證券

Rank 相関 NAME_JPN SOURCE

0 0.91 出荷季:鉱工業 経済産業省大臣官房

1 0.71 生産:鉱工業 経済産業省大臣官房

2 0.70 所定外給与:調査産業計:30人~ 厚生労働省

3 0.61 売上高指数(前年同月比) 商工中金

4 0.60 出荷:鉱工業 経済産業省大臣官房

5 0.58 所定外給与:調査産業計:5人~ 厚生労働省

6 0.58 所定外時間:調査産業計:30人~ 厚生労働省

7 0.53 乗用車:合計 一般社団法人日本自動車工業会

8 0.50 所定外時間:調査産業計:5人~ 厚生労働省

9 0.49 輸出台数:四輪車合計 一般社団法人日本自動車工業会

Page 166: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

5

図表 2: 商業動態統計とマクロ指標の相関(上位 10)

出所) 野村證券

図表 3: 第 3 次産業活動指数とマクロ指標の相関(上位 10)

出所) 野村證券

図表 4: 新車登録台数とマクロ指標の相関(上位 10)

出所) 野村證券

1.3.2 ターゲットマクロ指標とキーワードを含むブログ件数の相関

前述の探索において、マクロ指標と関連が強いと考えられるキーワードを選定し、そのキーワードが含まれ

るブログ件数のブログ全体に占める割合を算出し、ターゲットマクロ指標との相関(前年同月比)を確認し

た。各ワードは表記揺れ(寿司 | すし)や時期の特定(残業 & 今日)に対応するため、適宜オア条件(“|”)

およびアンド条件("&”)も試している。相関を算出した約 200個のキーワードの一覧は Appendix A.2に

示した。

Rank 相関 NAME_JPN SOURCE

0 0.96 商業計 経済産業省大臣官房

1 0.82 景気動向調査:全体 帝国データバンク

2 0.74 発泡酒課税移出数量 発泡酒の税制を考える会

3 0.72 ガス販売量(大手4社):合計 一般社団法人日本ガス協会

4 0.70 ガス販売量:合計 資源エネルギー庁

5 0.70 訪日外客:総数 日本政府観光局(JNTO)

6 0.68 Cカード業:取扱高計 経済産業省経済産業政策局

7 0.67 情報サービス業:売上高合計 経済産業省大臣官房

8 0.66 クレジットカード信用供与額合計 一般社団法人日本クレジット協会

9 0.66 百貨店・スーパー:販売額指数 経済産業省大臣官房

Rank 相関 NAME_JPN SOURCE

0 1.00 季:全産業活動指数 経済産業省大臣官房

1 0.97 全産業活動指数 経済産業省大臣官房

2 0.97 第3次産業総合 経済産業省大臣官房

3 0.80 Cカード業:取扱高計 経済産業省経済産業政策局

4 0.80 訪日外客:総数 日本政府観光局(JNTO)

5 0.80 事業社数:ファーストフード (社)日本フードサービス協会

6 0.79 クレジットカード信用供与額合計 一般社団法人日本クレジット協会

7 0.79 コンビニ販売額:合計 経済産業省大臣官房

8 0.79 コンビニ:全店:売上高(税別) (社)日本フランチャイズチェーン

9 0.73 事業社数:全体 (社)日本フードサービス協会

Rank 相関 NAME_JPN SOURCE

0 0.71 建築工事:受注高:総計 国土交通省総合政策局

1 0.69 生産:鉱工業 経済産業省大臣官房

2 0.68 中古車登録台数:合計 (社)日本自動車販売協会連合会

3 0.67 出荷:鉱工業 経済産業省大臣官房

4 0.66 新車登録:合計  (社)日本自動車販売協会連合会

5 0.63 乗用車:合計 一般社団法人日本自動車工業会

6 0.62 貨物輸送:JR貨物会社コンテナ 国土交通省総合政策局

7 0.62 リース業:契約高合計 経済産業省経済産業政策局

8 0.61 広告業:売上高合計  経済産業省経済産業政策局

9 0.61 商業計    経済産業省大臣官房

Page 167: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

6

図表 5-図表 8は各ターゲット指標と相関(前年同月比)の高かったキーワードの上位 10である。前節で

確認した鉱工業生産指数と所定外給与の高相関から類推される通り、鉱工業生産指数と「残業」というキ

ーワードを含むブログ件数の比率の相関が高いことが確認できた。また、全てのターゲットマクロ指標に共

通して、外食や行楽、ワインや宝くじなどの非生活必需品を表すキーワードとの相関が一定程度あること

が確認できた。この結果は、残業の増加による生産の増加による効果と、残業を減らすことで旅行や外食

によって消費が増える効果の両方が存在することを示しており、両者のバランスが経済政策として重要で

あることが示唆される。実際、1.5.2で作成した IIP予測モデルでも、「残業」だけでなく、非生活必需品を

表す多くのワードを併用することで精度が大きく向上することが確認できる。

鉱工業生産指数と「残業」を含むブログ件数の割合の推移を比較したのが図表 9である。いわゆるリーマ

ンショックの影響で 2008年後半の乖離が目立つが、全体的にはゆるやかな相関が確認できる(図表 10)。

これは残業を含む SNSの件数が実際に残業量と相関していることを示している。

ここでは、「残業」というキーワードを単純に含むかどうかで件数を数えているが、実際には残業を行ってい

ないと思われる記事(“今日は残業なしで早上がり”など)も相当数含まれている。そこで、次節以降では、

AI を用いて実際に残業したと思われる記事のみを抽出することで、より相関の高い系列の作成を試みる。

図表 5: 鉱工業生産指数とキーワード出現率の相関(上位 10)

注) 表中の”|”はオア条件、”&”はアンド条件を表す。以下の表も同様。

出所) 野村證券

図表 6: 商業動態統計とキーワード出現率の相関(上位 10)

出所) 野村證券

Rank 相関 キーワード

0 0.55 残業

1 0.54 ディズニーリゾート | ディズニーシー | ディズニーランド | ユニバーサルスタジオ | USJ

2 0.53 残業 & 今日

3 0.48 寿司 | すし

4 0.46 残業 | 休日出勤

5 0.45 ランチ

6 0.45 ディナー

7 0.43 ジム

8 0.43 飲み会

9 0.42 ビール

Rank 相関 キーワード

0 0.61 イタリアン | フレンチ

1 0.44 プレミアム

2 0.43 ランチ

3 0.42 ディナー

4 0.42 ディズニーリゾート | ディズニーシー | ディズニーランド | ユニバーサルスタジオ | USJ

5 0.42 ワイン

6 0.41 プレゼント

7 0.41 高級

8 0.37 着払 | 代引 | 振込

9 0.37 買いもの

Page 168: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

7

図表 7: 第 3 次産業活動指数とキーワード出現率の相関(上位 10)

出所) 野村證券

図表 8: 新車登録台数とキーワード出現率の相関(上位 10)

出所) 野村證券

図表 9: 「残業」含むブログ件数の割合と鉱工業生産指数

出所) 野村證券

Rank 相関 キーワード

0 0.60 旅行

1 0.53 宝くじ

2 0.52 観光

3 0.49 夜景

4 0.46 忙しい

5 0.44 ランチ

6 0.43 ディズニーリゾート | ディズニーシー | ディズニーランド | ユニバーサルスタジオ | USJ

7 0.40 旅館 | ホテル

8 0.40 ディナー

9 0.39 ワイン

Rank 相関 キーワード

0 0.60 夜景

1 0.58 ディズニーリゾート | ディズニーシー | ディズニーランド | ユニバーサルスタジオ | USJ

2 0.55 旅行

3 0.50 宝くじ

4 0.48 旅館 | ホテル

5 0.46 タクシー

6 0.46 ランチ

7 0.46 観光

8 0.42 ディナー

9 0.40 ワイン

0.002

0.0022

0.0024

0.0026

0.0028

0.003

0.0032

0.0034

0.0036

0.0038

6000

7000

8000

9000

10000

11000

12000

13000

2007年 2008年 2009年 2010年 2011年 2012年 2013年 2014年 2015年 2016年

鉱工業生産 ブログ「残業」(右軸)

IIP

変化

ブロ

グ件

数変

化幅

(全ブ

ログ

件数

で標

準化

))

Page 169: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

8

図表 10: 「残業」含むブログ件数/全ブログ件数 vs 鉱工業生産指数の月次変化率の XY プロット

出所) 野村證券

1.4 AI によるツイートの選別

一般に Twitterのようなマイクロブログは手軽に簡単に投稿できる為、軽い冗談、皮肉のようなものも多く

含まれている。また、最近ではスパムやボット、アフィリエイト等も多く、経済の実態を測る目的にはツイート

を選別してこれらの影響を除外する技術の確立が不可欠である。膨大なツイートを人手で選別するのは

現実的では無く、AIによるツイートの自動選別、自動抽出が必要である。本節では、残業ワードを含むツ

イートから、本当に残業したことを意味するツイート(残業ツイート)のみを抽出するモデルを作成した。

1.4.1 残業ツイート選別 AI 作成手順の概要

AI作成手順を図表 11に示す。モデルはディープラーニングを用いている。また、学習したモデルでテス

トデータに対する推計を行った結果を図表 12に示す。

回帰係数の t値=7.18

Page 170: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

9

図表 11: 残業ツイート選別 AI 作成手順

出所) 野村證券

図表 12 教師データと予測の比較

出所) 野村證券

予測ラベル

残業 非残業

付与ラベル残業 64 7

非残業 13 16

「残業」が含まれる全ツイート

サンプルのツイート

残業ツイート 非残業ツイート

モデル

人間による分類

残業 非残業 残業 非残業

訓練データ

学習 検証

全ツイートに適用

テストデータ

Page 171: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

10

上記で作成した AIを利用して、「残業」を含むツイートから残業ツイート選別 AIにより残業ツイートを選

別(AIフィルタリング)したのちの件数の時系列を図表 13に、図表 14に「残業」を含むツイート件数に対

する AIフィルタリング後の件数の割合(抽出率)の時系列を示す。「残業」を含むツイート件数は時折数日

間だけ極端に件数が増加する期間が複数見られる。この原因としてはハッシュタグ付きツイートが急増し

ている等の要因が考えられる。一方、AIフィルタリング後の時系列はこのピーク部分が大幅に取り除かれ

ていることが分かる。また、ピークに限らず AIフィルタリング後の時系列は「残業」を含むツイートよりも少

なくなっているが、これらの要因としてはアルバイトの募集ツイート、アダルトサイトのツイート等があり、これ

らが恒常的に取り除かれていると考えられる。

図表 13 「残業」を含むツイート件数と AI フィルタリング後の件数の推移

出所) 野村證券

図表 14 抽出率の推移

出所) 野村證券

0.0

0.5

1.0

1.5

2.0

2.5

3.0

3.5

4.0

4.5

5.0

2009/1 2010/1 2011/1 2012/1 2013/1 2014/1 2015/1 2016/1

ツイート数

(万件

)

「残業」を含むツイート数 AIフィルタリング後の残業ツイート件数

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

2009/1 2010/1 2011/1 2012/1 2013/1 2014/1 2015/1 2016/1

抽出率

Page 172: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

11

AIフィルタリングによって抽出されたツイートと IIPの変化率(対前月)の相関を図表 15に示す。IIP を

AIフィルタリング後のツイート件数で回帰すると、t値は 4.56 となり、統計的に有意な正の相関が確認で

きる。

図表 15 AI フィルタリング後の残業ツイート件数と IIP との相関

出所) 野村證券

1.4.2 モデル学習データに関して

学習用の訓練データに関しては、人がツイートを読み、残業ツイート/非残業ツイートに分類する必要が

ある。分類に要した平均的な 1ツイート当たりの判断時間は 10~15秒程度である。

1.5 IIP 推定時系列モデルの作成

日次で取得可能な様々な時系列を利用して IIPを推計するモデルを作成することを目的とする。

① 日次データを利用することで、本来的には月次で公表される IIPを日々補完できる可能性

がある

② 様々なデータを利用することで、推計精度向上が期待できる

y = 0.4145x - 0.0026

-25%

-20%

-15%

-10%

-5%

0%

5%

10%

15%

20%

25%

-30% -20% -10% 0% 10% 20% 30%

鉱工業生産指数

(季節調整なし

)の変化率

(対前月

)

AIフィルタリング後の残業ツイート件数変化率(対前月)

回帰係数の t値=4.56

Page 173: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

12

今回の分析では、季調済 IIPの前月比(前月からの変化率)を被説明変数とし、説明変数には日次デー

タに対して各月の平均値を算出し、その時系列の前月比を算出したものに対して季節調整を行った時系

列を用いた。ただし、製造工業生産予測指数(当月見込)に関しては月次データから前月比を算出してい

る。変数は 2009年 1月から 2016年 10月までの期間を取得し、この期間におけるモデルを推計した。

説明変数に関して、以下の 4カテゴリを考慮してモデルを作成した。合わせて、各カテゴリで考慮したデ

ータの種類数についても記載している。

1.製造工業生産予測指数(当月見込) :1データ

2. マーケットデータ(株価、為替等) :8データ

3.ツイート件数データ(各キーワードを含むツイートの件数を加工したデータ):12データ

4. ブログ件数データ:308データ

1.5.1 製造工業生産予測指数を用いた IIP 予測モデル(ベンチマーク)

ベンチマークとして、製造工業生産予測指数のみから IIPを予測するモデルを作成する。モデル推定結

果を図表 16に示す。製造工業生産予測指数の t値は 7.02であり、IIP と統計的に有意な正の相関関

係を持つことが分かる。しかし、決定係数、及び、自由度調整済決定係数は 34~35%程度であり、製造工

業生産予測指数のみのモデルでは精度が低い結果となった。

図表 16 製造工業生産指数による IIP 予測モデル(ベンチマーク)

出所) 野村證券

1.5.2 SNS を利用した IIP 予測モデル

製造工業生産予測指数に加え、マーケットデータ、ツイート件数データ(キーワード「残業」)、ブログ件数

データを利用して IIPを予測するモデルを作成した。各種データに関しての詳細は Appendix0に掲載

している。

モデルの推定結果を図表 17に示す。決定係数、及び、自由度調整済決定係数は 82%~85%であり、ベ

ンチマークの 34~35%程度と比較して非常に高い精度で推計できるモデルと考えられる。選択されたファ

クターに関して、マーケットデータの日経平均株価は IIP と正の相関を持つと推計された。ツイート件数デ

ータ(キーワード「残業」)に関しては、残業ツイート率(対日本のツイート全件数)は IIP と正の相関を持つと

推計された。ブログ件数データに関しては「市販車」、「納車」、「車検」:自動車購入の可能性に関連する

キーワード、「ユンケル」:栄養ドリンク剤に関連するキーワード、「伊勢丹」:高級百貨店に関連するキーワ

ード、「めでたい メデタイ 目出度い」:ポジティブな状況を表すキーワードと、IIPが正の相関を持つと推

計された。一方、「余裕_無い ない」、「稼働_ライン」、「解雇」、「ワイン」は IIP との相関の定性的な理解

が難しい部分がある。様々な時系列との相関関係を探索することで発見できた関係性ではあるが、キーワ

ードの設定により想定とは異なるブログを取得していないかなどの精査は必要であろう。

係数 t値

0.494 7.02

0.000935 0.393

AIC

決定係数

自由度調整済決定係数

34.9%

34.2%

-440

製造工業生産予測指数(当月見込)

切片

ファクター

Page 174: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

13

図表 17 各種時系列を利用した IIP 予測モデル

注) 表中の”_”はアンド条件であることを表す

出所) 野村證券

ファクター 係数 t値

0.567 13.69

日経平均株価 0.0600 2.286

残業ツイート率 0.0378 2.261

ブログ[余裕_無い ない] -0.212 -6.048

ブログ[稼働_ライン] -0.0327 -3.812

ブログ[市販車] 0.0253 3.494

ブログ[解雇] 0.0298 3.302

ブログ[納車] 0.0638 3.016

ブログ[ワイン] 0.0765 2.699

ブログ[ユンケル] 0.0198 2.610

ブログ[めでたい メデタイ 目出度い] 0.0353 2.303

ブログ[伊勢丹] 0.0244 2.289

ブログ[車検] -0.0447 -2.199

-0.00221 0.393

AIC

決定係数

自由度調整済決定係数

製造工業生産予測指数(当月見込)

切片

-554

84.9%

82.5%

Page 175: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

14

IIP前月比とモデル推計値を図表 18、図表 19に示す。図表 18は実績値と推計値の時系列を表示して

いるが、IIP と極端に乖離している部分が無いことが確認できる。図表 19では推計値と実績値を散布図

で表示しており、y=xの近傍に推計値が分布していることから推計精度の高さが確認できる。

図表 18 IIP(前月比)実績値と推計値の時系列

出所) 野村證券

図表 19 IIP(前月比)実績値と推計値の関係

-20%

-15%

-10%

-5%

0%

5%

10%

200

9/1

200

9/7

201

0/1

201

0/7

201

1/1

201

1/7

201

2/1

201

2/7

201

3/1

201

3/7

201

4/1

201

4/7

201

5/1

201

5/7

201

6/1

201

6/7

前月比

実績値 推計値

-20%

-15%

-10%

-5%

0%

5%

10%

-20% -15% -10% -5% 0% 5% 10%

実績値

推計値

y=x

Page 176: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

15

出所) 野村證券

2008年 12月の IIP実績値を 100 とし、 2009年 1月以降は前月実績値と予想前月比を用いて逐次的

に IIPを予想した場合の結果を図表 20、図表 21に示す。製造工業生産予測指数のみ利用したモデル

は東日本大震災があった 2011年 4月の推計を大きく外していることが分かる。

図表 21 ではモデルの決定係数等を比較しているが、各種時系列を利用したモデルの精度が高い。また、

製造工業生産予測指数のみ利用したモデルが大きく外した 2011年 4月を除いて算出した決定係数を

比較した場合でも各種時系列を利用したモデルの精度の方が高い結果となった。

図表 20 IIP(水準)の各モデルによる推計

出所) 野村證券

図表 21 IIP(水準)の推計精度のモデル間比較

出所) 野村證券

1.5.3 参考: SNS のみを用いて作成した場合のグラフ

参考として、日経平均や製造工業予測指数を用いずに SNS 指標だけで作成した場合のグラフを下記に

掲載した。SNS ファクターを選び直した場合の自由度調整済決定係数は 59.5%であり、選び直さなかっ

た場合は 34.8%であった。

80

85

90

95

100

105

110

115

2008/12 2009/12 2010/12 2011/12 2012/12 2013/12 2014/12 2015/12

IIP(2008年12月

を100に

基準

化)

IIP実績値

製造工業生産予測指数のみ利用したモデル

SNSを利用したモデル

(1) 全期間

決定係数自由度調整済

決定係数

製造工業生産予測指数のみ利用したモデル 81.9% 81.7%

各種時系列を利用したモデル 96.0% 95.3%

(2) 2011年4月を除く期間

決定係数自由度調整済

決定係数

製造工業生産予測指数のみ利用したモデル 83.6% 83.4%

各種時系列を利用したモデル 95.9% 95.2%

Page 177: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

16

図表 22: SNS のみを利用したモデル

出所) 野村證券

図表 23: SNS のみ利用したモデル(最適なファクターを再選択)

出所) 野村證券

80

85

90

95

100

105

110

1152008/12

2009/6

2009/12

2010/6

2010/12

2011/6

2011/12

2012/6

2012/12

2013/6

2013/12

2014/6

2014/12

2015/6

2015/12

2016/6

IIP(2008年12月

を100に

基準

化)

実績値

SNSのみ利用したモデル

(最適なファクターを再選択)

SNSのみを利用したモデル

(「SNSを利用したモデル」と同じSNSファクター)

ファクター 係数 t値

残業ツイート率 0.0223 0.875

ブログ[残業_今日] 0.324 5.700

ブログ[チャイルドシート] -0.123 -4.671

ブログ[ガソリン] -0.00850 -4.113

ブログ[貯蓄] -0.103 -3.560

ブログ[伊勢丹] 0.0561 3.330

ブログ[宝くじ] 0.0488 2.938

ブログ[死にたい] -0.131 -2.745

ブログ[売り残り] -0.0100 -2.233

ブログ[解雇] 0.0288 2.129

ブログ[リッチ] 0.0208 2.090

切片 0.00150 0.705

AIC

決定係数

自由度調整済決定係数

-476.3

64.3%

59.5%

Page 178: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

17

図表 24: SNS のみ利用したモデル(ファクターの再選択無し)

出所) 野村證券

1.5.4 重回帰モデル作成時の注意点

重回帰モデル作成時には下記の点に注意する必要がある。

① サンプル数に対して説明変数の数が非常に多いため、どのように変数選択を行うか

② 全ての説明変数と被説明変数が統計的に有意な相関を持っているか

③ 多重共線性が強いモデルとなっていないか

本分析ではブログ件数データの種類が非常に多いため、まず、製造工業生産予測指数に加え、マーケッ

トデータ、ツイート件数データ(キーワード「残業」)の 3カテゴリについて 1つ以上のファクターが選択され

るようにモデルの候補を考える。その候補から多重共線性回避のためにファクター間の相関が 0.5を超え

るファクターのペアを含むモデルを除外し、これらの候補に対して重回帰分析を行う。その上で全てのファ

クターが統計的に有意となるモデルを全て残す(ベースモデル群)。

これらの各々のベースモデル群に対して、以下の操作を行う。ブログ件数データのファクターを 1つ選択

し、全てのファクター間の相関係数が 0.5以下であれば説明変数に追加し、重回帰分析を行う。全てのフ

ァクターが統計的に有意となるモデルであれば候補として残す。これを全てのブログ件数データに対して

行い、候補として残ったモデルのうち AICが最小となるモデルを選択する。続いて、再度ブログ件数デー

タから同様な手順でファクターを追加する。これを繰り返し、ファクターを追加した際に条件を満たすモデ

ルが無い場合、または、追加したファクターの合計が 10を超える場合はファクターの追加を停止する。ま

た、最終的に多重共線性の警告がでないことを確認する(Pythonの statsmodelsパッケージを利用)。

各々のベースモデルに対しブログ件数データを追加したモデルが残るが、この中で AICを最小化するモ

デルを選択する。このようにして、多くの変数候補から効率的に説明力が高くかつ統計的に有意なファク

ターを選択することができる。

ファクター 係数 t値

残業ツイート率 0.0539 1.683

ブログ[余裕_無い ない] -0.101 -1.542

ブログ[稼働_ライン] -0.0422 -2.555

ブログ[市販車] 0.0326 2.346

ブログ[解雇] 0.0428 2.477

ブログ[納車] 0.0664 1.628

ブログ[ワイン] 0.0210 0.388

ブログ[ユンケル] -0.0118 -0.841

ブログ[めでたい メデタイ 目出度い ]0.0398 1.348

ブログ[伊勢丹] 0.0450 2.206

ブログ[車検] -0.0540 -1.388

切片 -0.000600 -0.241

AIC

決定係数

自由度調整済決定係数 34.8%

-431.6

42.5%

Page 179: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

18

2. 地域の経済活動を表す指標算出のための新手法の研究・開発

2.1 Summary

本章では、Twitterから景気に関するツイートを大量に取得し、センチメントを算出し、さらにこれを地域

別に集計することで、地域の景気指標を日次で補足する指標の開発を試みた。景気に関するツイートを

大量に抽出するために、景気ウォッチャー調査を学習データとして自動的に景気に関するツイートを抽出

する AIを開発した。次に、抽出されたツイートの景気に関するセンチメントを判定する AIを同じく景気ウ

ォッチャー調査を用いて学習した。

まず、AIによる抽出によって約 5,000/月のツイートが無料で抽出できた。これは景気ウォッチャー調査の

回答数より多く、地域別、産業別の集計にも有利である。また、AIによって評価されたセンチメントを月次

で集計することで、景気ウォッチャー調査 DI と高い相関があることも確認できた。

また、地域に関しては、ツイートの書き込みやユーザー情報に含まれる地名からの算出を検討した。地名

が含まれるツイートは約 20%であった。都道府県レベルでは地域化も不可能ではない件数と考えられる

が、一般名詞や人名との誤認も多く見られた。精度と件数の問題は AIによる地名特定や、ツイート件数

の増加によって、改善出来ると考えられる。

本手法を発展させることで、これまでコストの面から困難であったより詳細かつ速報性の高い地域指数の

開発が期待でき、災害への対応や地方創生に関する政策をより適切に行う一助となると期待される。

Twitter から得られた景気指標と景気ウォッチャー調査の比較

注) 本図表は 22 ページの図表 28 を転載した。

出所) 野村證券

2.2 分析手順

分析は以下の手順で行った。

1. 全ツイートから Twitter社が無料で提供する「Streaming API」でツイートを取得。(Streaming

APIは全ツイートの 1%程度のランダムサンプリング)

42

44

46

48

50

52

54

56

2015年

5月

6月 7月 8月 9月 10月 11月 12月

景気ウォッチャー

現状DI

景気ウォッチャー

先行きDI

Twitter

景気

相関 現状DI 先行きDI Twitter

現状DI - 0.88 0.67

先行きDI 0.88 - 0.89Twitter 0.67 0.89 -

Page 180: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

19

2. 1で得られたツイートから、景気に関するものを AIで抽出。

3. 2で得られた景気に関するツイートのセンチメントを AIで評価。

4. 3で得られたセンチメントを地域別に集計

出所) 野村證券

1.に関して、Streaming APIではなく、3章と同様に自営業者のツイートや、キーワード抽出したツイート

を用いることも可能であるが、ここでは無料の APIでどこまで可能かを検証すると言う目的も考慮して、

Streaming APIのみを用いることとした。3章の考察にもある通り、自営業者のみのツイートに絞った場

合にも、結果に大きな影響はないと考えられるが、検証できる期間はデータの制約から 8カ月となってい

る。

2.3 景気に関するツイートの抽出

Streaming APIから日本語のツイートのみを抽出し、さらにリツィートを除いた結果、平均で約 1,600万

件/月のツイートが得られた。このツイートに対し深層学習(RCNN)を用いることで、景気ウォッチャー調査

の回答との類似度を算出するモデルを作成した。景気ウォッチャー調査の回答は全て何らかの意味で(街

角)景気に関するコメントであるため、このようにして得られたツイートは景気に関するツイートになると考え

られる。以降では、類似度が 0.9を超えるツイートのみを用いることで、景気に関するツイートを抽出した。

図表 25から、このようなツイートは 200万件当たり 460件であり、極一部のツイートのみを抽出して分析

に用いていることになる。

全ツイートStreaming

API景気に関するツイート

AIによる抽出(景気ウォッチャー調査)

景気センチメント

AIによるセンチメント評価(景気ウォッチャー調査)

地域別景気センチメント Twitterユーザー情

報, ツイートに含まれる地域名

Page 181: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

20

図表 25: “Streaming API ツイート”200 万件に景気類似度の分布

出所) 野村證券

2.4 抽出したツイートのセンチメント評価

前節で抽出したツイートの内容が景気にポジティブかネガティブか(以下、センチメント)を判定するために、

ディープラーニングによるセンチメント評価モデルを作成した。ここでは、景気ウォッチャー調査の約 20万

件のサンプルを教師データとして学習した。データのサンプルを図表 26に示した。判断理由のテキストを

入力とし、判断結果を教師ラベル(良くなる=1、悪くなる=0)として学習した。

モデルは LSTMを用いた。手法の詳細については [1]を参照されたい。

図表 27はテストデータの判別精度である。正答率(Accuracy)は現状判断で 93.0%、先行き判断で

93.9%となっており、高い精度で文書のセンチメントを判定することが出来ている。

図表 26: 景気ウォッチャー調査データの例

出所) 野村證券

モデル適用データ 2,000,000単語数が10以上のデータ 1,053,042httpを含まないデータ 732,196

街角景気に関するコメントとの類似度

0.9~1.0 4600.8~0.9 1120.7~0.8 860.6~0.7 900.5~0.6 810.4~0.5 1030.3~0.4 1510.2~0.3 2240.1~0.2 4200.0~0.1 730,469

判断理由 (テキスト) 判断結果

最近は客の反応も非常に良いため、先行きはやや良くなる。 良くなる

競合店が開店して1年経過する6月からは、前年比をクリアできる。しかし、初期の売上からみると少し厳し

い状況である。青果の相場も少しずつ上がっているが、夏物衣料の不振で衣料品が厳しい状況だ。天候の影響もあるのか前年の83%で推移している。

良くなる

値下げする商品の減少及び仕入れた商品のさばきをみる限り、順調と思える。 良くなる

東日本大震災の影響は避けられず、厳しい状況となる。 悪くなる

12月以降、受注状況が2010年度比で下回る月が出てきている。 悪くなる

消費税増税後の反動は確実に出てくる。政府の対応施策に期待したい。 悪くなる

Page 182: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

21

図表 27: 景気ウォッチャー調査テキストのセンチメント判別精度

注) 適合率: 正(景気回復)と予測したデータのうち,実際に正であるものの割合

再現率: 実際に正であるもののうち,正であると予測されたものの割合

F 値: 適合率と再現率の調和平均

出所) 野村證券

現状判断 Accuracy: 93.0%

適合率 再現率 F値 サンプル数

0: 景気悪化 0.93 0.94 0.95 7,5531: 景気回復 0.93 0.91 0.92 6,498

avg/total 0.93 0.93 0.93 14,051

先行き判断 Accuracy: 93.9%

適合率 再現率 F値 サンプル数

0: 景気悪化 0.94 0.94 0.94 7,3571: 景気回復 0.94 0.94 0.94 7,164

avg/total 0.94 0.94 0.94 14,521

Page 183: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

22

2.5 指数の算出

前節までで、Streaming APIから景気に関するツイートを抽出し、さらに各ツイートのセンチメントを算出

した。図表 28は、さらにそれを月次で平均し、言語処理学習の教師データに用いた景気ウォッチャー調

査の DI と比較したものである。もし、開発した AIが Twitterから景気ツイートを正しく抽出し、センチメン

トを正しく評価していれば、得られた指数は景気ウォッチャーDI と高い相関を示すと期待される。図より、

開発した指標(Twitter景気)は景気ウォッチャーの DI と高い相関を示しており、特に、景気ウォッチャー

の先行き DI との相関は約 0.89(決定係数は約 79.6%)と高くなっている。今回の調査では利用できる

Streaming APIデータが8カ月と限られていたため、統計的な有意性や安定性を議論することは難しい

が、将来的に景気ウォッチャーDIのリアルタイム予測を期待させる結果と言える。

図表 28: Twitter から得られた景気指標と景気ウォッチャー調査の比較

出所) 野村證券

2.6 地域化に関する考察

次に、得られた指数を地域別に集計する手法について議論する。地域化の手法として、

– Twitterのユーザー情報の登録地域から

– ツイートに含まれる地域名から

の 2 通りを検討した。前者については、母集団の約 56%のユーザーが何らかの地域名を入力していたが、

「画面(ディスプレイを表し、ゲームやネットの世界の住人であるという意味だと思われる)」、「やまのなか」、

等、分析に用いることは困難なデータも多かった。また、国内の景気に関する書き込みも多く、居住地域と

言及している景気の地域が一致していない例も多く見られた。これらから、後者の「ツイートに含まれる地

域名」の方がより的確に地域の景況感を表すことが出来ると推察された。

図表 29は景気に関するツイートして抽出されたツイートのうち、GeoNLP [2]に登録されている 2文字以

上地域名を含むツイートの割合である。平均で約 16%のツイートが地域名を含んでいる。ただし、これに

は人名や一般名詞(平和、中央、国立)と思われるツイートも含まれており、逆に GeoNLPには登録されて

いない駅名や施設名を含むツイートは含まれていない。図表 30は言及が多かった地域のランキングであ

る。最も多いのは“大阪”で、国内最大の地方都市であり文化圏全体への言及も多いと考えられる。2番の

42

44

46

48

50

52

54

56

2015年

5月

6月 7月 8月 9月 10月 11月 12月

景気ウォッチャー

現状DI

景気ウォッチャー

先行きDI

Twitter

景気

相関 現状DI 先行きDI Twitter

現状DI - 0.88 0.67

先行きDI 0.88 - 0.89Twitter 0.67 0.89 -

Page 184: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

23

“福島”は震災や原発事故への言及が多いと考えられる。他に、京都や沖縄は都市としてのブランド価値

を反映していると考えられる一方で、平和、中央、国立、等の一般名詞としても使われる地域名が上位に

来ている。これらの一般名詞や人名との混同は前後の文脈を考慮した機械学習モデルを構築することで、

ある程度省くことが可能と考えられる。図表 31はさらに、属する都道府県ごとにツイート件数を集計した結

果である(同じ地域名が複数の都道府県にある場合、両者に加えた)。最も言及数が多かった都道府県は

北海道で、次いで福岡、大阪、東京、神奈川、愛知の順となっており、人口が多くブランド価値の高い都

道府県が上位に来ていると考えられる。

図表 29: 地域名を含むツイート数の割合

出所) 野村證券

図表 30: 地域名別集計

出所) 野村證券

Page 185: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

24

図表 31: 都道府県別ツイート数

出所) 野村證券

2.7 今後の課題と社会への応用に関する考察

本事業では、安定した地域別指数日次算出までは作成できなかったが、ツイート抽出の件数と精度を上

げる手法はいくつか考えられ、例えば Streaming APIを全ツイートデータである FireHoseに変えること

で約 100倍のツイートが得られ、また地域の特定も地名キーワードだけでなく前後の文脈や普段のツイー

トを用いることで AIによるより高精度な推定が可能と考えられる。

このような取り組みによって将来的には低コストで大量の地域の「街角景気」に関する投稿が取得可能と

なった場合、災害への対応や地方創生に関する政策の立案、国家戦略特区での政策評価といった地域

レベルでの実体経済の評価、比較が重要な場面に応用できると期待される。また、観光やマーケティング

といった分野で民間での活用も想定され、このような指標の開発・公表自体が地域経済の活性化を促進

すると期待される。

Page 186: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

25

3. 中小企業における景況感を表す指標の研究・開発

3.1 Summary

中小企業景況調査で学習した AI と Twitterデータを用いて、日次レベルで算出可能な中小企業景況

感指数の開発を行った。AIは中小企業景況調査を学習データに用い、A) 大量のツイートから景気に関

するツイートのみを抽出する、 B) 景気に関するツイートのセンチメント(景気にポジティブ/ネガティブ)を評

価する、の 2つを行う。

AIによって得られた景気に関するツイートのセンチメントに対して何らかの集計を行うことで、中小企業景

況感を表す指数を得ることが出来る。本事業では、活用の 1つの例として、まず、AIによって得られた各

ツイートのセンチメントを単純平均することで指数化した。さらに 2つ目の例として、3 ヵ月に 1度公表され

る中小企業景況調査業況判断 DI(以下、中小企業業況判断 DI)をフィッティングするようモデル化し、得

られた指数が元の中小企業業況判断 DI と高い相関(決定係数=約 81.6%)があることを確認した(下図)。

なお、このモデル化には日経平均や為替といった日次で更新可能な他の指標も活用することが出来る。

いずれの指数も月次、週次、日次といったより短い期間で算出することも可能なので、従来と比較して速

報性の高い中小企業の景況感指数として用いることが可能と期待される。

中小景況 Tweet 指数と中小企業業況判断 DI

注) 本図表は 35 ページの図表 45 を転載した。

出所) 野村證券

開発された指数は日次で更新可能であり、かつ中小企業業況判断 DI と長期的に高い相関がある。日次

かつ低コストな中小企業景況感の把握に有効と期待される。

3.2 分析手順

分析は以下の手順で行った。

1. 全ツイートから「なずき [3]」による自営業者のツイートを抽出。(合わせて、なずきを用いず Twitter

の Streaming APIのみを用いた分析も行った)

2. 1で得られた自営業者のツイートから、さらに景気に関するものを AIで抽出。

3. 2で得られた自営業者の景気に関するツイートのセンチメントを AIで評価。

4. 3で得られたセンチメントを用いて中小企業の景況感を表す指数を算出

-50

-45

-40

-35

-30

-25

-20

-15

2011/9 2012/9 2013/9 2014/9 2015/9 2016/9

中小景況Tweet指数

中小企業業況判断DI

DI

Page 187: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

26

出所) 野村證券

3.3 中小企業景気に関するツイートの抽出

本節では 2.3 と同様の手法を中小企業景況調査に変えて行っている。まず、”なずき”を用いて取得した”

自営業者ツイート”と中小企業景況調査データに対し深層学習(RCNN)を用いることで、自営業者ツイー

トから中小企業景気に関するものを抽出した。上述のモデルを用いてツイート 2,000,000件に対して中小

企業景況調査類似度を評価したのが図表 32になる。当モデルを用いて中小企業景況調査類似度が高

いツイートを抽出することで、ツイートの中から中小企業景況調査のような文章を抽出することが可能であ

ると考えられる。判定結果(確率)が 0.1, 0.5, 0.9以上となったツイート数の分布を示したのが図表 33 とな

る。中小企業景況調査類似度が 0.9以上となるツイートでも十分な量のツイートを取得可能であり、自営

業ツイートから中小企業景況感に関するツイートが抽出可能であることがわかる。

なおこの結果では、2010年以前は数値がばたついており、また 2011年 3月に異常なピークが見えるこ

とが分かる。これらの原因として、2010年以前ではそもそものツイート数が少ないこと(図表 34)、2011年

3月には震災の影響により景気に関するツイートが増えたこと(図表 34灰色線)があげられる。

なずき* 抽出

全ツイート自営業者のツイート

景気に関するツイート

AIによる抽出(中小企業景況調査)

中小企業景気センチメント

AIによるセンチメント評価

(中小企業景況調査)

Page 188: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

27

図表 32: “自営業者ツイート”200 万件に占める中小企業景況調査類似ツイートの数

出所) 野村證券

図表 33: 抽出されたツイートの割合

出所) 野村證券

モデル適用データ 2,000,000単語数が10以上のデータ 1,053,501httpを含まないデータ 732,575

中小企業景気に関するコメントとの類

似度

0.9~1.0 2,7390.8~0.9 1,1250.7~0.8 1,1740.6~0.7 1,1900.5~0.6 1,2740.4~0.5 1,4220.3~0.4 1,8720.2~0.3 2,3610.1~0.2 3,4260.0~0.1 715,992

0

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

2007/04 2008/04 2009/04 2010/04 2011/04 2012/04 2013/04 2014/04 2015/04 2016/04

抽出されたツイートの割合 0.1~

0.5~

0.9~

Page 189: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

28

図表 34: 震災前後での景気に関するツイートの増加

出所) 野村證券

3.4 抽出したツイートのセンチメント評価

2.4節と同様に、前節で抽出したツイートの内容がポジティブかネガティブかをディープラーニングを用い

て判別した。調査票の順番に倣い、教師ラベルは好転=0、悪化=1 としており、景気ウォッチャー調査と逆

となっていることに注意されたい。

モデルは 2.4節と同様である。図表 35はテストデータの判別精度である。正答率(Accuracy)は 80.1%と

なっており、概ね正解しているものの、景気ウォッチャーと比較して低い精度となった。この原因としては、

かな・漢字の表記揺れや誤字脱字、好転・悪化を間違えて業況判断を回答している こと等が考えられる。

以下では、この AIセンチメント判別モデルと抽出されたツイートを用いて、景況感指数を算出する。

図表 35: 中小企業景況調査テキストのセンチメント判別精度

注) 適合率: 正(悪化)と予測したデータのうち,実際に正であるものの割合

再現率: 実際に正であるもののうち,正であると予測されたものの割合

F 値: 適合率と再現率の調和平均

出所) 野村證券

3.5 指数の算出

3.3で得られた、自営業者によるツイート(2007/4/1~2016/11/30)のうち中小企業調査類似度が 0.9以

上となるツイートに対し 3.4のモデルを用いてセンチメントを計算した。例として 2015年 5月の各ツイート

のセンチメントの分布を図表 36に示す。ここではセンチメントとして悪化が-1、好転が+1 となるように計算

した。他の月でもセンチメントの分布は同様の形状をしている。

0

10,000

20,000

30,000

40,000

50,000

0

200,000

400,000

600,000

800,000

1,000,000

1,200,000

>0.1ツイート数

全自営業ツイート数

全自営業Tweet数(左

軸)

>0.1Tweet数(右軸)

業況判断 Accuracy: 80.1%

適合率 再現率 F値 サンプル数

0: 好転 0.71 0.41 0.52 1,4751: 悪化 0.83 0.94 0.88 4,456

avg/total 0.80 0.81 0.79 5,931

Page 190: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

29

この計算により得られた各ツイートのセンチメントを月ごとに平均した月次センチメント指数の推移は図表

37のようになっている。2011年頃以前でセンチメント指数の変動が大きくなっているのは、図表 34から

わかるように、センチメント計算に用いるツイート数が少ないことが原因と考えられる。したがって以降の指

数算出では 2011年 4月以降のデータのみ用いることとする。

図表 36: センチメントの分布

出所) 野村證券

0

500

1,000

1,500

2,000

-1~

-0.9

-0.9~

-0.8

-0.8~

-0.7

-0.7~

-0.6

-0.6~

-0.5

-0.5~

-0.4

-0.4~

-0.3

-0.3~

-0.2

-0.2~

-0.1

-0.1~

0

0~

0.1

0.1~

0.2

0.2~

0.3

0.3~

0.4

0.4~

0.5

0.5~

0.6

0.6~

0.7

0.7~

0.8

0.8~

0.9

0.9~

1

件数

sentiment

Page 191: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

30

図表 37: センチメントの推移

出所) 野村證券

3.5.1 得られた指数と中小企業業況判断 DI の相関

前述の計算で得られた各ツイートのセンチメントを 3/2~6/1・6/2~9/1・9/2~11/15・11/16~3/1の各期

間で平均し、中小企業業況判断 DI と比較した結果が図表 38である。2011年 4月以降のツイート数が

十分ある期間でこれらの相関を見たのが図表 39 となる。両者の決定係数は約 71.8%と高い値になる。

また、水準同士でなく変化率(幅)同士で比較した結果は図表 40および図表 41 となる。変化幅同士の

決定係数は約 49.2%となり、変化幅で見ても得られたセンチメント指数と中小企業業況判断 DIは高い相

関があるといえる。

なお、前述の手法以外に各ツイートのセンチメントを(好転と判定される確率 – 悪化と判定される確率)と

して計算した場合や、センチメント指数でなく DI指数化したもの(センチメントが 1/3~1 となるツイート数

– センチメントが-1~-1/3 となるツイート数)も分析・計算した。しかし、中小企業業況判断 DI と最も相関が

高かったのは、前述のセンチメント指数となる。

-0.38

-0.34

-0.30

-0.26

-0.22

-0.18

2007/04 2008/04 2009/04 2010/04 2011/04 2012/04 2013/04 2014/04 2015/04 2016/04

se

nti

me

nt

Page 192: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

31

図表 38: センチメントと中小企業系調査 DI の推移(水準)

出所) 野村證券

図表 39: センチメントと中小企業系調査 DI の推移(水準)

出所) 野村證券

y = 765.51x + 172.04R² = 0.7178

-45

-40

-35

-30

-25

-20

-0.28 -0.27 -0.26 -0.25

中小企業業況判断

DI

sentiment

Page 193: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

32

図表 40: センチメントと中小企業系調査 DI の推移(変化幅)

出所) 野村證券

図表 41: センチメントと中小企業系調査 DI の相関(変化幅)

出所) 野村證券

y = 406.71x + 0.5301R² = 0.4918

-10

-5

0

5

10

15

-0.02 -0.01 0 0.01 0.02

中小企業業況判断

DIの変化幅

Sentimentの変化幅

Page 194: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

33

3.5.2 時系列モデルの作成: 中小景況 Tweet 指数

前述のツイートから得られた指数と日経平均を組み合わせることで、中小企業景況調査を推定する時系

列モデルを作成した。

ここではセンチメント指数・日経平均と中小景況調査 DIの変化率同士を比較することで指数の作成を行

った。変化率同士とした理由は、水準同士で作成したモデルでは系列相関が大きいからである(中小企業

業況判断 DIをセンチメント指数で回帰すると、水準同士ではダービン・ワトソン比が 0.72(データ数 22)、

変化率同士ではダービン・ワトソン比が 1.98(データ数 21))。

中小企業業況判断 DIは 3カ月毎の公表であるが、ここでは日次で公表できる指数の構築を目指す。そ

のためには、過去ある程度の期間の景況感を表しつつ毎日更新される値をその指数構築に使う必要があ

る。ここでは、指数構築に用いるファクターとして各日における「センチメント指数、および日経平均の過去

13週間日次平均の値」を用いた。

なお、過去平均に用いる期間としては 1~20週間の全ての場合を計算した結果 13週平均を用いる場合

が中小企業調査 DI との重回帰における自由度調整済決定係数が一番大きくなった。また、日経平均以

外の指標としてドル円レート、国債 10年利回り、NOMURA-BPI/Extended(国債除く)の複利利回りも指

数計算への組み入れ候補として考慮したが、指標の全組合せを試した結果、センチメント指数と日経平均

の組合せの自由度調整済決定係数が一番大きくなった。(図表 42参照)

センチメント指数及び日経平均の過去 13週間平均の変化率を用いて中小企業業況判断 DIの変化率

の重回帰分析を行った結果が図表 43 となり、決定係数は約 54.3%である。センチメント指数・日経平均

共に t値が 2を超えており、中小企業業況判断 DIの推計に有意に効いていることが分かる。またこの結

果から次式の「中小景況 Tweet指数の変化幅」を計算することが出来る。

中小景況 Tweet指数の変化幅 = sentiment指数 13週間平均の変化幅 × 326.04

+ 日経平均 13週間平均の log リターン × 14.23 + 0.01

この作成した指数の変化幅と中小企業業況判断 DIの変化幅を比較すると図表 44 となっている。

また、この式から「中小景況 Tweet指数」として以下の指数を作成することが出来る。

中小景況 Tweet指数 = 前回 DI発表時点の中小景況 Tweet指数

+ sentiment指数 13週間平均の前回 DI発表時点からの変化幅 × 326.04

+ 日経平均 13週間平均の前回 DI発表時点からの log リターン × 14.23 + 0.01

この式により作成した指数と中小企業業況判断 DIの関係は図表 45 となる。これらの相関関係は図表

46に示したとおりであり、水準同士の決定係数は 81.6%と高い精度で中小企業業況判断 DIを推計でき

ている。

Page 195: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

34

図表 42: 用いるデータ平均期間とモデル精度

出所) 野村證券

図表 43: 得られたモデルの係数と t 値

出所) 野村證券

ファクター 係数 t値

Sentiment指数 326.0444 3.444

日経平均 14.232 2.126

切片 0.006741 0.012

決定係数

自由度調整済決定係数 49.2%

54.3%

Page 196: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

35

図表 44: 開発した”中小景況 Tweet 指数(日次)”と中小企業業況判断 DI の推移(変化幅)

出所) 野村證券

図表 45: 開発した”中小景況 Tweet 指数(日次)”と中小企業業況判断 DI の推移(水準)

出所) 野村證券

-8

-4

0

4

8

12

中小景況Tweet指数 中小企業業況判断DI

-50

-45

-40

-35

-30

-25

-20

-15

2011/9 2012/9 2013/9 2014/9 2015/9 2016/9

中小景況Tweet指数

中小企業業況判断DI

DI

Page 197: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

36

図表 46: 開発した”中小景況 Tweet 指数”と中小企業業況判断 DI との相関

出所) 野村證券

y = 0.7534x - 6.5777R² = 0.8162

-45

-40

-35

-30

-25

-20

-15

-45 -40 -35 -30 -25 -20

中小企業業況判断

DI

中小景況Tweet指数

Page 198: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

37

4. 指標の安定的な公表に向けたプロトタイプの開発

4.1 Summary

本章の分析はこれまでの結果を踏まえて、追加的に約 1 ヵ月の期間で実施した。主に指標の長期的な公

表を想定し、コストと安定性の観点から検証を行った。まず、コストの削減とデータ量の拡張の観点から、

Twitter 社が提供する無料の API を活用することを検証した。Streaming API を用いた場合、実際の検証

は約 2 週間弱と短期間であったが、2,300 万を超える大量のツイートを取得でき、サーバーの負荷や記憶

領域のコストの観点からは十分に運用が可能であることを確認した。一方、何らかの原因でシステムが停

止することが期間中に数回あり、その期間のツイートを取得できない事態となり、システムの改善やバック

アップ体制の構築に一定のコストを掛ける必要性が感じられた。また、REST API による取得では、特定の

キーワードを含むツイートを網羅的に取得できることも確認した。いずれの取得方法も過去に遡って取得

することは出来ないため、一定期間が経過するまでは、中長期的な検証を行うことが出来ないと欠点も明

らかとなった。

実際の指標の算出をテストするため、3 章で開発した中小景況 Tweet 指数のリアルタイム推計を実験的

に行った。まず、モデルの精度と安定性を改善するために、3 章で開発したモデルを拡張してブログデー

タも含めたモデルを構築した。次に、この改良されたモデルに対して、データソースをなずきから

Streaming API に変更し、その差異を検証したのが下図である。保持している過去の Streaming API デー

タの制約から、検証期間は約 3 ヵ月と十分ではないものの、両者の相関は高く(決定係数=約 78.2%)、

Streaming API を用いても、モデル精度の観点では大きな問題は生じないと想定される。

この両者の関係を新たに取得している 2017年 3月の Streaming APIデータに適用することで、中小景況

Tweet 指数のプロトタイプとした。検証期間が短く、3 章のように 13 週間の移動平均を取ることも出来なか

ったため、日々の変動性は大きいが、日次での指数算出が問題なく行えることを確認すること出来た。

中長期的な公表に向けた今後の課題として、ツイート取得の安定性とコストを考慮したより良いデータ取

得方法の検討、データソースの多様化による精度・安定性の向上、より長期間の検証によるアウトサンプ

ルデータでの精度・安定性のテストが挙げられる。

開発したリアルタイムに更新可能な中小企業の景況感を表す指数

注) 本図表は 45 ページの図表 57 を転載した。

出所) 野村證券

-22.5

-22.3

-22.1

-21.9

-21.7

-21.5

-21.3

-21.1

-20.9

-20.7

-20.5

各指数値

中小景況Tweet指数(ブログあり、なずき) 中小景況Tweet指数(ブログあり、Streaming)

Page 199: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

38

4.2 API による Twitter データの収集

なるべく低コストで大量のデータを取得する目的で、Twitter社が提供する無料の API である Streaming

API と REST API の 2つをテストした。両 APIを用いて自動でツイートを取得するシステムを構築し、約 2

週間程度の検証を行うことが出来た。

4.2.1 Streaming API

Streaming API は Twitter 社が提供する無料 APIの 1つで、全ツイートの中からランダムに抽出された一

部のツイート(public streams と呼ばれる)をリアルタイムに取得することが出来る APIである。全ツイートに

対する、public streamsの割合は公表されていないが、後述の通り、”残業”を含むツイートについて REST

API と比較したところ、約 1%であった。全ツイートに対しては約 1%とは言え、後述の REST API(最大 1200

ツイート/分)に比べると大量のツイートを取得できるのが Streaming APIの特徴で、中小企業景気の指標

を開発した際に用いたように、自営業者のツイートを大量に取得したいと言った目的には適している。一

方、大きな欠点として過去のツイートを取得することは出来ないため、過去時系列の分析や、何らかの理

由で取り逃した場合に再取得することは不可能である。

Streaming APIで得られる日本語ツイートから、リツイートを除いて集計した結果、約 2週間弱の検証期間

に 2,300万を超える大量のツイートを取得でき、サーバーの負荷や記憶容量の観点からは運用が十分に

可能であることを確認した。ツイート数を 1時間ごとにグラフ化したのが図表 47である。1時間当たり約 6

万~12万ツイートの間で推移しており、中央値は約 8万件であった。また、botを除く目的で、Streaming

API の source タグに botを含むものを除いた結果、中央値が約 7万件となり約 1万件減少した。同様に、

ピークは約 8万件となり、約 4万件減少した。

3月 15日の昼頃等、ツイート件数が急激に減少している時間帯が数回あるが、これは何らかの理由で構

築した収集システムが止まってしまったためである。システムの見直しやバックアップ体制の準備によって

改善できる可能性はあるが、取り逃したツイートは遡って取得できないため、指標の算出を安定的に運用

する際には大きな課題となる。

図表 47: Streaming API による日本語ツイートの件数(リツイート除く、1 時間毎)

出所) 野村證券

システムの停止

Page 200: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

39

図表 48: Streaming API による日本語ツイートの件数(bot 除く、リツイート除く、 1 時間毎)

出所) 野村證券

4.2.2 REST API

REST APIは Twitter社が提供する無料 APIの 1つで、主な機能は指定した条件でのツイート読み込み

とツイートの書き込みである。主に、ツイートの読み込み/書き込みを行えるアプリを開発する目的で使用さ

れていると想定される。この REST API を用いることで、特定の検索条件やユーザーを指定して全てのツ

イートを取得することが出来る。また、過去分については、1 週間分は遡って取得することが可能である。

ただし、使用量は制限されており、1 回に 100 ツイートかつ 15 分に 180 回までしか使用できない。よって、

平均的に 1,200 ツイート/分以上の投稿があるような一般的なワードを含むツイートを全て取得することは

出来ない。IIPのリプリケイトで行ったような、”残業”を含むツイートを全て取得するといった目的には向い

ている。また、中小企業景気指数で行った、自営業者のツイートを全て取得したいと言った場合にも、事

前に指定したユーザーアカウントのツイートを全て取得することで、使用量の制限の範囲内で可能である。

図表 49は期間中に取得した”残業”を含むツイートの件数の推移である。ピーク時でも 2,500件/時間程

度であり、取得上限である 1,200 件/分と比較すると 5%程度であることが分かる。このことから、1章で行っ

たような、単独のキーワードを指定してモデルを構築する場合、REST APIが有効に機能すると期待される。

Streaming APIのランダム抽出の割合がどの程度かを検証する目的で、図表 54のように、残業を含むツ

イートの件数を Streaming API と REST APIで比較した。青線で示した両者の割合は約 1%から 20%の間で

推移しており、全期間の平均では約 4.2%であった。REST APIが残業を含む全ツイートを含んでいると仮

定すると、Streaming API は全ツイートの平均で約 4%のツイートを含んでいると考えられる(ただし、時間に

よる差異が大きく、Streaming API のピーク時間が深夜である点には注意が必要である)。

Page 201: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

40

図表 49: 残業を含むツイート数(リツイート除く)

出所) 野村證券

図表 50: 残業を含む Streaming API と REST API の比較

出所) 野村證券

4.3 ブログデータの追加を検証

指標を安定的に公表するためには、一つのデータソースに依らず、複数のソースを用いることも重要と考

える。本節では、3章で作成した中小企業景況 Tweet 指数にブログデータを加えた場合の精度・安定性

の変化を検証した。

Page 202: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

41

1.5.2の手法と同様にして、自由度決定係数や AICを基準にモデルを選択したところ、ブログデータとし

て「サービスエリア」を含むブログ件数、「カーナビ」を含むブログ件数、「クレカ」または「クレジット」を含む

ブログ件数が有効であると考えられる。これらの時系列データを中小企業業況判断 DI の推計への変数と

して用いて分析を行った。ここでは 3章同様、13週平均値の変化率を元に推計した。その結果は図表

51の通りである。なお、モデルの決定係数は 86.2%であり、自由度調整済決定係数で比較しても、ブログ

データを用いないモデル(図表 43)と比較して 49.2%から 81.2%まで大きく上昇している。また、安定性の観

点からは、日次変化幅の標準偏差は 10.9%から 8.7%に減少しており、平均的な日々の変動幅も減少して

いることが分かった。

図表 51: モデル係数

出所) 野村證券

どのファクターの t値も 2 を超えており、これらのファクターが中小企業業況判断 DI の説明力が高いと言

える。これらのブログ件数が中小企業業況判断 DI と有意に相関している原因として、以下のようなことが

考えられる。

・「サービスエリア」というブログの増加は、トラックなど長距離運転手の移動中の投稿の増加つまり物量の

増加を反映している。

・「カーナビ」というブログの増加は、旅行の増加つまり仕事量の減少を反映している。また、上記の「サー

ビスエリア」からトラックではない一般の旅行者の書き込みによる影響を除く働きもあると想定される。

・「クレカ, クレジット」の増加は、消費の増加を反映している。

また、この結果から中小景況 Tweet指数は以下のように計算できる。

中小景況 Tweet指数 = 前回 DI発表時点の中小景況 Tweet指数

+ sentiment指数 13週間平均の前回 DI発表時点からの変化幅 × 214.18

+ 日経平均 13週間平均の前回 DI発表時点からの log リターン × 19.51 + 0.05

+ 「サービスエリア」ブログ件数 13週間平均の前回 DI発表時点からの log リターン × 11.42

+ 「カーナビ」ブログ件数 13週間平均の前回 DI 発表時点からの log リターン × (-17.02)

+ 「クレカ, クレジット」ブログ件数 13週間平均の前回 DI発表時点からの log リターン × 16.94

この指数は図表 52のようになっている。また、ブログありの場合の中小企業業況判断 DI との相関は図表

53のようになっており図表 46 よりも精度が向上していることが確認できる。指標の意味やアウトサンプル

での精度向上を検証する必要はある。

ファクター 係数 t値

Sentiment指数 214.1817 2.683

日経平均 19.512 4.031

ブログ[サービスエリア] 11.4224 4.712

ブログ[カーナビ] -17.0198 -3.333

ブログ[クレカorクレジット] 16.9427 2.033

切片 0.04564 0.115

決定係数

自由度調整済決定係数

86.2%

81.2%

Page 203: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

42

図表 52: 時系列プロットの比較

出所) 野村證券

図表 53: ブログを含むモデル推定値 vs. 中小企業景況感 DI

出所) 野村證券

4.4 Streaming API を用いることの影響

Streaming API を用いたツイートと、なずきの”自営業者ツイート”を用いた場合の比較を行った。それぞれ

に対し、センチメントを計算したのが図表 54になる。4.2.1 で述べたように Streaming APIではデータが取

れていない場合に後から取ることが出来ず、欠落が出来てしまう。一方、3 章で用いたように 13 週平均し

た値を使うことでこの影響は緩和することが出来る(ただしデータ欠落日のセンチメントは前日と同じとし

-50

-45

-40

-35

-30

-25

-20

-15

2011/9 2012/3 2012/9 2013/3 2013/9 2014/3 2014/9 2015/3 2015/9 2016/3 2016/9

各指数値

中小企業業況判断DI 中小景況Tweet指数(BLOGなし) 中小景況Tweet指数(BLOG追加)

y = 0.8525x - 4.3379R² = 0.8943

-45

-40

-35

-30

-25

-20

-15

-45 -40 -35 -30 -25 -20

中小企業業況判断

DI

中小景況Tweet指数(ブログあり)

Page 204: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

43

た)。この観点からも日次で公表する指数であっても一定期間の移動平均を取ることは安定性の観点から

重要と考えられる。移動平均した場合の比較を図表 55に示した。

Streaming APIによるセンチメントとなずきによるセンチメントの関係は図表 56のようになっており、その決

定係数は約 78.2%で Streaming APIによるツイートを用いても中小企業 Tweet指数の算出は可能だと考

えられる。

この回帰から得られる以下の式で示される関係、

なずき(自営業)センチメント = Streaming センチメント × 1.2456 + 0.0635

および 4.3の式を用いて推計した中小企業 Tweet指数は図表 57のようになり、なずきのツイートを用い

た場合と類似した指数になっていることが確認できる。

図表 54: Streaming API と なずき のセンチメント比較(日次)

出所) 野村證券

図表 55: Streaming API と なずき のセンチメント比較(13 週移動平均)

出所) 野村證券

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

2015/7/1 2015/8/1 2015/9/1 2015/10/1 2015/11/1 2015/12/1

sen

tim

en

t

streaming なずき(自営業)

-0.257

-0.255

-0.253

-0.251

-0.249

-0.247

sen

tim

en

t

streaming なずき(自営業)

Page 205: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

44

図表 56: Streaming API vs. なずき センチメント

出所) 野村證券

y = 1.2456x + 0.0635R² = 0.7816

-0.256

-0.255

-0.254

-0.253

-0.252

-0.251

-0.250

-0.2565 -0.256 -0.2555 -0.255 -0.2545 -0.254 -0.2535 -0.253 -0.2525 -0.252

なずき

(自営業

)

Streaming

Page 206: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

45

図表 57: 得られた指数の比較

出所) 野村證券

4.5 自動計算システムの開発と課題

ここまでの分析より、計算やデータの保存処理に掛かる計算コストはそれほど高くは無く、日次は勿論、リ

アルタイムでの処理も可能であることを確認した。ここでは、構築したモデルと Streaming API を用いて、

実際に日次で指数を算出した結果を参考に紹介し、課題について考察する。

4.3及び 4.4の式、2017年 3月 9日~2017年 3月 21日の Streaming APIによるツイートを用いて推計

した中小景況 Tweet指数は図表 58 となる。ここで、当指数は変化率から推計しているため、2017/3/9 時

点の指数を 0 とおいた。また、日経平均、ブログ件数に関しては 13週平均の値を用いたが、Streaming

APIによるツイートは 12日分しかないため、平均値を用いずに各日のセンチメントをそのまま用いた。そ

の結果得られた指数の変動は 13週平均した図表 57 と比べて非常に大きくなってしまっている。従って、

Streaming APIによるツイートを用いる場合には、データをさらに貯める必要がある。

これらを踏まえて、本章の検証から明らかとなった課題について述べる。まず、Streaming APIの過去時系

列データが取得できないことが、運用やモデルの改善に於いて大きな弊害となると想定される。特にデー

タ収集についてはサーバーの停止等にも備える必要があるため、同様の収集システムを複数稼働させる

等の対応も必須で、コストも膨らむと考えられる。また、Twitterの REST API を用いる場合にも過去には 1

週間しか遡れず、根本的な解決は難しいと考えられる。このような観点から、無料の APIを用いた指標の

安定的な公表や商用サービスの提供は困難も多く、本実証実験でも用いた”口コミ@係長”や”なずき”と

いった商用サービスの利用や併用も検討すべきと考えられる。

また、少数のデータソースを用いた場合、そのデータソースが何らかの原因で利用できなくなるリスクもあり、

リアルタイム性を損なわない範囲で、多様なデータソースを用いるのが望ましいと考えられる。その候補と

しては、本稿でも試みた複数のブログデータや市場データが挙げられ、さらにニュースや経済レポート、

POSデータといった、経済事象を表す様々なデータが考えられる。

さらに、今後の課題として、本事業ではデータの制約や検証期間の短さから、アウトサンプルでの検証を

十分に行えなかった点も挙げられる。インサンプルの推計(過去データへのフィッティング)で良い精度が

出たとしても、アウトサンプルで不安定ということも考えられるため、今後はデータを貯めながら少なくとも数

ヵ月の検証期間を設ける等の施策が必要と考えられる。

-22.5

-22.3

-22.1

-21.9

-21.7

-21.5

-21.3

-21.1

-20.9

-20.7

-20.5

各指数値

中小景況Tweet指数(ブログあり、なずき) 中小景況Tweet指数(ブログあり、Streaming)

Page 207: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

46

図表 58: 日次指数の試算値

出所) 野村證券

-30

-20

-10

0

10

20

30

40

中小景況

Tw

eet指数

Page 208: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

47

5. 参考文献

[1] 山本裕樹、松尾豊, “景気ウォッチャー調査を学習データに用いた金融レポートの指数化,” 日本人工知能学会,

2016.

[2] “GeoNLP - 文章を自動的に地図化する地名情報処理システム,” [オンライン]. Available:

https://geonlp.ex.nii.ac.jp/.

[3] “トータル日本語解析ソリューションなずき,” [オンライン]. Available: https://nttdata-nazuki.jp/.

Page 209: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

48

Appendix A. 既存の経済統計指標を代替・補完する新指標の開発・評価

A.1 マクロ指標一覧

季調

フラグ データソース 分類 1 分類 2 系列名 1 系列名 2

1 0 経済産業省大臣官房 国内産業 サービス 原系列 全産業活動指数 全産業活動指数

2 1 経済産業省大臣官房 国内産業 サービス 季調済 全産業活動指数 季:全産業活動指数

3 0 国税庁 国内産業 食料品 課税移出数量 ビール ビール課税移出数量

4 0 日刊経済通信社 国内産業 食料品 課税移出数量 新ジャンル 新ジャンル課税移出数

5 0 発泡酒の税制を考える会 国内産業 食料品 課税移出数量 発泡酒 発泡酒課税移出数量

6 0 一般社団法人日本クレジット協会 国内産業 サービス 合計 クレジットカード信用供与額合

7 0 国土交通省総合政策局 国内産業 建設 受注高 総計 受注高:総計

8 0 国土交通省総合政策局 国内産業 建設 受注高総計(国内+海外) 受注高:総計

9 1 国土交通省総合政策局 国内産業 建設 受注高 総計(季節調整済) 受注高:総計(季調済)

10 1 国土交通省総合政策局 国内産業 建設 受注高総計(国内+海外)(季節調

整済) 受注高:総計(季調済)

11 0 日本チェーンストア協会 国内産業 商業 販売金額 総販売額 販売額:総販売額

12 0 (社)日本フランチャイズチェーン 国内産業 商業 全店ベース 店舗売上高(税別) コンビニ:全店:売上高(税別)

13 0 経済産業省大臣官房 国内産業 商業 販売額 合計 コンビニ販売額:合計

14 0 経済産業省資源エネルギー庁 国内産業 電力・ガス 発電電力量 発電電力量

15 0 電気事業連合会 国内産業 電力・ガス 販売電力合計(10 社計) 10社計:販売電力合計

16 0 電気事業連合会 国内産業 電力・ガス 大口電力主要業種販売電力量(9

社計)合計 業種別:9社計:合計

17 0 経済産業省資源エネルギー庁 国内産業 電力・ガス 一般電気事業者発受電電力量合

計(9社計)

一般9社計:発受電電力量合

18 0 経済産業省資源エネルギー庁 国内産業 電力・ガス 一般電気事業者発受電電力量(10

社計)

一般事業10社計:発受電電

力量

19 0 経済産業省大臣官房 国内産業 石油・石油製品 原油 生産 原油:生産

20 0 経済産業省大臣官房 国内産業 石油・石油製品 ガソリン 生産 ガソリン:生産

21 0 帝国データバンク 国内産業 企業活動 全体 全体

22 0 厚生労働省 国内経済 労働・雇用・人口 事業所規模5人以上 所定外労働

時間 調査産業計 所定外労働時間:調査産業計

23 0 厚生労働省 国内経済 労働・雇用・人口 事業所規模 30 人以上 所定外労

働時間 調査産業計 所定外労働時間:調査産業計

24 0 国土交通省総合政策局 国内産業 運輸・倉庫 貨物輸送 JR 貨物会社(コンテナ) 貨物輸送:JR貨物会社コンテ

25 0 経済産業省大臣官房 国内産業 製造業共通 業種分類 鉱工業 在庫:鉱工業

26 1 経済産業省大臣官房 国内産業 製造業共通 業種分類 鉱工業 在庫季:鉱工業

27 0 経済産業省大臣官房 国内産業 製造業共通 業種分類 鉱工業 生産:鉱工業

28 1 経済産業省大臣官房 国内産業 製造業共通 業種分類 鉱工業 生産季:鉱工業

29 0 経済産業省大臣官房 国内産業 製造業共通 業種分類 鉱工業 出荷:鉱工業

30 1 経済産業省大臣官房 国内産業 製造業共通 業種分類 鉱工業 出荷季:鉱工業

31 0 (社)日本フードサービス協会 国内産業 サービス ディナーレストラン 事業社数 事業社数

32 0 (社)日本フードサービス協会 国内産業 サービス ファーストフード 事業社数 事業社数

33 0 (社)日本フードサービス協会 国内産業 サービス ファミリーレストラン 事業社数 事業社数

34 0 (社)日本フードサービス協会 国内産業 サービス その他 事業社数 事業社数

35 0 (社)日本フードサービス協会 国内産業 サービス パブ/居酒屋 事業社数 事業社数

36 0 (社)日本フードサービス協会 国内産業 サービス 全体 事業社数 事業社数

37 0 (社)日本フードサービス協会 国内産業 サービス 喫茶 事業社数 事業社数

38 0 不動産経済研究所 国内産業 不動産 首都圏 契約率(B/A) 契約率(B/A)

39 0 不動産経済研究所 国内産業 不動産 首都圏 当月発売戸数(A) 当月発売戸数(A)

Page 210: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

49

40 0 不動産経済研究所 国内産業 不動産 首都圏 当月販売(契約)戸数(B) 当月販売(契約)戸数(B)

41 0 経済産業省大臣官房 国内産業 商業 商品別販売額 商品販売額 販売額:商品販売額

42 0 厚生労働省 国内経済 労働・雇用・人口 事業所規模 30 人以上 所定外給

与 調査産業計 所定外給与:調査産業計

43 0 厚生労働省 国内経済 労働・雇用・人口 事業所規模5人以上 所定外給与

調査産業計 所定外給与:調査産業計

44 0 経済産業省大臣官房 国内産業 商業 商品別販売額 商品販売額 商品別販売額:商品販売額

45 0 一般社団法人日本自動車工業会 国内産業 輸送用機器 台数 四輪車合計 輸出台数:四輪車合計

46 0 日本自動車輸入組合 国内産業 輸送用機器 総計 輸入車総計:合計

47 0 (社)日本自動車販売協会連合会 国内産業 輸送用機器 合計 新車登録:合計

48 0 一般社団法人日本自動車工業会 国内産業 輸送用機器 乗用車合計 乗用車:合計

49 0 (社)日本自動車販売協会連合会 国内産業 輸送用機器 合計 中古車登録台数:合計

50 0 農林水産省大臣官房統計部 国内産業 食料品 乳製品の生産量 バター バター

51 0 農林水産省大臣官房統計部 国内産業 食料品 乳製品の生産量 チーズ チーズ

52 0 農林水産省大臣官房統計部 国内産業 食料品 牛乳生産量 生乳生産量

53 0 農林水産省大臣官房統計部 国内産業 食料品 飲用牛乳等生産量 飲用牛乳 飲用牛乳

54 0 一般社団法人電気通信事業者協

会 国内産業 通信 携帯電話 携帯電話

55 0 国土交通省総合政策局 国内産業 運輸・倉庫 旅客輸送 JR 旅客会社(6社計) 旅客輸送:JR旅客会社(6社

56 0 厚生労働省医政局経済課 国内産業 医薬品 生産金額 医薬品総数 生産金額:医薬品総数

57 0 資源エネルギー庁 国内産業 電力・ガス 合計 ガス販売量:合計

58 0 一般社団法人日本ガス協会 国内産業 電力・ガス 大手4社合計 ガス販売量(大手4社):合計

59 0 経済産業省大臣官房 国内産業 商業 業種別商業販売額指数 商業計 商業計

60 1 経済産業省大臣官房 国内産業 商業 業種別商業販売額指数(季調済)

商業計 (季):商業計

61 0 経済産業省経済産業政策局 国内産業 サービス 売上高合計 広告業:売上高合計

62 0 経済産業省経済産業政策局 国内産業 サービス 取扱高計 Cカード業:取扱高計

63 0 経済産業省経済産業政策局 国内産業 サービス 受注高計 エンジニア:受注高計

64 0 経済産業省大臣官房 国内産業 サービス 売上高合計 情報サービス業:売上高合計

65 0 経済産業省経済産業政策局 国内産業 サービス リース業 契約高合計 リース業:契約高合計

66 0 経済産業省経済産業政策局 国内産業 サービス レンタル業 売上高合計 レンタル業:売上高合計

67 0 国土交通省 国内産業 輸送用機器 合計 造船受注:合計

68 0 国土交通省(観光庁観光産業課) 国内産業 運輸・倉庫 主要 50 社 国内旅行 総取扱額:国内旅行

69 0 国土交通省(観光庁観光産業課) 国内産業 運輸・倉庫 総取扱額 国内旅行 総取扱額:国内旅行

70 0 国土交通省(観光庁観光産業課) 国内産業 運輸・倉庫 総取扱額 外国人旅行 総取扱額:外国人旅行

71 0 国土交通省(観光庁観光産業課) 国内産業 運輸・倉庫 総取扱額 海外旅行 総取扱額:海外旅行

72 0 経済産業省大臣官房 国内産業 商業 販売額指数 合計 販売額指数:合計

73 0 経済産業省大臣官房 国内産業 商業 合計 販売額指数 合計 販売額指数:合計

74 0 経済産業省資源エネルギー庁 国内産業 電力・ガス 発電電力量合計 発電電力量:合計

75 0 経済産業省大臣官房 国内産業 サービス 原系列 第3次産業総合 第3次産業総合

76 1 経済産業省大臣官房 国内産業 サービス 季調済 第3次産業総合 季:第3次産業総合

77 0 日本政府観光局(JNTO) 国内産業 サービス 目的別 商用客 韓国 訪日外客:商用客:韓国

78 0 日本政府観光局(JNTO) 国内産業 サービス 目的別 その他客 韓国 訪日外客:その他客:韓国

79 0 日本政府観光局(JNTO) 国内産業 サービス 目的別 観光客 韓国 訪日外客:観光客:韓国

80 0 日本政府観光局(JNTO) 国内産業 サービス 総数 訪日外客:総数

81 0 商工中金 国内産業 企業活動 売上高 売上高指数(前年同月比)

82 0 商工中金 国内産業 企業活動 景況判断指数 景況判断指数

83 0 商工中金 国内産業 企業活動 販売価格(上昇−下落) 全産業 販売価格DI(上昇−下落)

出所) 野村證券

Page 211: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

50

A.2 キーワード候補一覧

No. キーワード No. キーワード

1 ETC 104 デパート & 今日

2 JAF 105 帰れない

3 ごほうび 106 年休

4 アリナミン 107 廃車

5 イタリアン | フレンチ 108 引っ越し

6 エアーバッグ 109 徹夜

7 エスファイト 110 忙しい

8 オイル交換 111 手取り

9 カジノ 112 手数料

10 カフェ 113 手紙

11 カーナビ 114 振込

12 カー用品 115 教習所

13 ガソリン 116 散財

14 ガソリン & スタンド 117 料金所

15 キーロック 118 新幹線

16 クルーズ 119 新築

17 クール宅配便 120 新車

18 コンビニ 121 新車 & 下取り

19 ゴルフ 122 新車 & 発表

20 サビ残 123 旅行

21 サービスエリア 124 旅館 | ホテル

22 ジム 125 日本酒

23 スーパー 126 映画 | カラオケ | ボーリング | ビリヤード

24 セール 127 景気

25 タイヤ & パンク 128 月極

26 タイヤ交換 129 有休

27 タクシー 130 有給

28 ダンボール 131 有給 | 有休 | 年休 | 有給休暇

29 チェーン店 132 有給休暇

30 チャイルドシート 133 梱包

31 ディズニーリゾート | ディズニーシー | ディズニーランド |

ユニバーサルスタジオ | USJ 134 死にそう

32 ディナー 135 死にたい

33 ディーラ 136 残業

34 デパート 137 残業 & 今日

35 デパ地下 138 残業 | 休日出勤

36 デート 139 残業代

37 トラック 140 洗車

38 ドライブ 141 混んでる | 混みすぎ

39 ナンバープレート 142 渋滞

40 バイク 143 温泉

41 バイク便 144 満員電車

42 バイト 145 病院

Page 212: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

51

43 バー 146 発泡酒

44 パチンコ | 競馬 | 競輪 | 競艇 147 眠い

45 パート 148 着払

46 ビール 149 着払 | 代引 | 振込

47 ファミレス 150 睡眠不足

48 フル稼働 151 納期

49 ブラック 152 納車

50 ブラック企業 153 納車 & 今日

51 クレカ 154 終電

52 クレカ | クレジット 155 マツキヨ

53 プチ贅沢 | ぷち贅沢 156 マツキヨ & 今日

54 プレゼント 157 給料

55 プレミアム 158 缶コーヒー

56 マラソン 159 自動車 & ローン

57 マンション 160 自動車 & 税

58 ミシュラン 161 自動車 & 重量税

59 モーターショー 162 自動車保険

60 ユンケル 163 自賠責

61 ランチ 164 自賠責 & 保険

62 ラーメン 165 自転車

63 リッチ 166 荷物

64 リフォーム | リノベーション 167 薬

65 レンタカー 168 行きたくない

66 ロードサービス 169 観光

67 ローン 170 試乗

68 ワイン 171 請求書 | 領収書

69 一軒家 | 戸建 172 貯蓄

70 下道 173 貯金

71 不在連絡票 174 買いもの

72 中古車 & 査定 175 買った

73 中古車 & 買い取り 176 賃貸

74 仕事 177 赤帽

75 仕事 & 疲れた 178 走行距離

76 仕事 & 終わらない 179 起業

77 仕事 & 辛い 180 車 & モデルチェンジ

78 仕事 & 遅い 181 車 & 乗り換え

79 仕事 | 暇 182 車両保険

80 代引 183 車庫証明

81 代車 184 車検

82 仮眠 185 車種

83 休日出勤 186 転勤

84 倉庫 187 送料

85 借金 188 通関

86 免許更新 189 通院

87 出張 190 遊び | 遊んだ | 遊ぶ

88 単身赴任 191 運転代行

89 国道 192 配車

Page 213: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

52

90 増産 193 配達

91 外食 194 限定車

92 夜勤 195 電車

93 夜景 196 飛行機

94 宅配 197 飲み会

95 宅配 & 便 198 駐車場

96 定時退社 199 駐車違反

97 宝くじ 200 高級

98 寝れない | 眠れない 201 高速道路

99 寿司 | すし 202 伊勢丹

100 居酒屋 203 伊勢丹 & 今日

101 市販車 204 外食 & 今日

102 帰りたい 205 新車 & 購入

103 コンビニ & 今日 206 流行

出所) 野村證券

A.3 IIP 予測モデルの候補ファクター

いずれのファクターも日次で取得可能なものである。表は t 値の絶対値が大きな順に表示している。ブロ

グに関しては上位 25 キーワードのみ掲載している。

A.3.1 マーケットデータ(8 データ)

出所) 野村證券

A.3.2 ツイート件数データ(12 データ)

出所) 野村證券

# ファクター 相関係数 t値 決定係数

1 日経225平均株価 0.303 3.046 9.16%

2 東証株価指数:一部総合 0.272 2.713 7.41%

3 ダウ工業株30種:終値 0.269 2.674 7.21%

4 S&P500種 0.249 2.463 6.19%

5 NYSE総合指数 0.240 2.373 5.77%

6 NASDAQ総合指数:終値 0.223 2.191 4.96%

7 NASDAQ工業株指数 0.221 2.169 4.86%

8 ドル/円:終値(17時) -0.006 -0.062 0.00%

# ファクター 相関係数 t値 決定係数

1 [ガソリン]件数 ÷ 対国内全ツイート件数 -0.554 -6.383 30.69%

2 [ガソリン]件数 -0.540 -6.150 29.14%

3 [褒美 | ほうび]件数 ÷ 対国内全ツイート件数 0.307 3.097 9.44%

4 [褒美 | ほうび]件数 0.301 3.025 9.05%

5 [残業]件数 0.292 2.929 8.53%

6 [好調]件数 0.278 2.780 7.75%

7 [好調]件数 ÷ 対国内全ツイート件数 0.269 2.681 7.24%

8 [接待]件数 0.242 2.397 5.88%

9 [残業]件数 ÷ 対国内全ツイート件数 0.220 2.168 4.86%

10 [イタリアン | フレンチ | 寿司 | カレー | レストラン]件数 0.217 2.128 4.69%

11 [接待]件数 ÷ 対国内全ツイート件数 0.178 1.737 3.18%

12 [イタリアン | フレンチ | 寿司 | カレー | レストラン]件数 ÷ 対国内全ツイート件数 0.146 1.417 2.13%

Page 214: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

53

A.3.3 ブログ件数データ(308 データ)

# ファクター 相関係数 t 値 決定係数

1 ガソリン -0.567 -6.594 32.09%

2 ガソリン_スタンド -0.565 -6.575 31.97%

3 残業_今日 0.454 4.882 20.58%

4 夜景 0.442 4.726 19.54%

5 飲み会 0.436 4.641 18.97%

6 増産 -0.423 -4.473 17.86%

7 稼働_ライン -0.418 -4.416 17.49%

8 残業 0.411 4.327 16.91%

9 接待 0.409 4.301 16.74%

10 ランチ 0.404 4.237 16.33%

11 帰れない -0.401 -4.195 16.06%

12 生産ライン -0.398 -4.158 15.82%

13 忙しい 0.393 4.105 15.48%

14 レストラン 0.388 4.039 15.06%

15 残業 休日出勤 0.385 4.006 14.85%

16 ビール 0.378 3.919 14.31%

17 残業_疲れた 0.373 3.853 13.89%

18 観光 0.362 3.723 13.09%

19 カフェ 0.361 3.712 13.03%

20 褒美 ほうび 0.357 3.663 12.73%

21 イタリアン フレンチ 寿司 カレー レストラン 0.351 3.601 12.35%

22 終電 0.350 3.583 12.24%

23 ボーナス_期待 0.349 3.569 12.16%

24 イタリアン フレンチ 寿司 カレー レストラン_今日 0.348 3.562 12.12%

25 仕事_疲れた 0.345 3.520 11.87%

出所) 野村證券

Page 215: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

54

ディスクレイマー

本資料は表紙に記載されている野村グループの関連会社により作成されたもので、表紙などに従業員やその協力者が記載されている1社ある

いは複数の野村グループの関連会社によって単独あるいは共同で作成された資料が含まれます。ここで使用する「野村グループ」は、野村ホ

ールディングス、およびその関連会社と子会社を指し、また、日本の野村證券(「NSC」)、英国のノムラ・インターナショナル plc (「NIplc」)、米国

のノムラ・セキュリティーズ・インターナショナル・インク (「NSI」)、インスティネット LLC (「ILLC」)、香港の野村国際(香港) (「NIHK」)、韓国のノム

ラ・フィナンシャル・インベストメント(韓国) (「NFIK」) (韓国金融投資協会(「KOFIA」)に登録しているアナリストの情報は KOFIA のイントラネット

http://dis.kofia.or.kr でご覧いただけます)、シンガポールのノムラ・シンガポール・リミテッド (「NSL」) (登録番号 197201440E、 シンガポール金

融監督局に監督下にあります)、オーストラリアのノムラ・オーストラリア・リミテッド (「NAL」) (ABN 48 003 032 513) (オーストラリアのライセンス

番号 246412、オーストラリア証券投資委員会(「ASIC」)の監督下にあります)、インドネシアの P.T.ノムラ・インドネシア (「PTNI」)、マレーシアのノ

ムラ・セキュリティーズ・マレーシア Sdn. Bhd. (「NSM」)、台湾の NIHK 台北支店 (「NITB」)、インドのノムラ・フィナンシャル・アドバイザリー・アン

ド・セキュリティーズ (インディア) プライベート・リミテッド (「NFASL」)、 (登録住所: Ceejay House, Level 11, Plot F, Shivsagar Estate, Dr. Annie

Besant Road, Worli, Mumbai- 400 018, India;電話: +91 22 4037 4037、ファックス: +91 22 4037 4111; CIN 番号:U74140MH2007PTC169116、

SEBI 登録番号(株式ブローカレッジ): BSE INB011299030、NSE INB231299034、 INF231299034、 INE 231299034, MCX: INE261299034、SEBI

登録番号(マーチャントバンキング):INM000011419、SEBI 登録番号(リサーチ):INH000001014)、スペインの NIplc マドリッド支店 (「NIplc,

Madrid」)が含まれます。リサーチ・レポートの表紙のアナリスト名の横に記載された「CNS タイランド」の記載は、タイのキャピタル・ノムラ・セキュ

リティーズ・パブリック・カンパニー・リミテッド (「CNS」)に雇用された当該アナリストが、CNS 及び NSL 間のアグリーメントに基づき、NSL にリサ

ーチ・アシスタントのサービスを行っていることを示しています。リサーチ・レポートの表紙の従業員氏名の横に記載された「NSFSPL」は、ノムラ・

ストラクチャード・ファイナンス・サービシーズ・プライベート・リミテッドに雇用された当該従業員が、インタ-カンパニー・アグリーメントに基づき、

特定の野村の関連会社のサポ―トを行っていることを示しています。リサーチ・レポートの表紙のアナリスト名の横に記載された「BDO-NS」

(「BDO ノムラ・セキュリティーズ・インク」を表します)の記載は、BDO ユニバンク・インク(「BDO ユニバンク」)に雇用され BDO-NS に配属された

当該アナリストが、BDO ユニバンク、NSL 及び BDO-NS 間のアグリーメントに基づき、NSL にリサーチ・アシスタントのサービスを行っていること

を示しています。BDO-NS は BDO ユニバンクと野村グループのジョイント・ベンチャーで、フィリピンの証券ディーラーです。 本資料は、(i)お客様自身のための情報であり、投資勧誘を目的としたものではなく、(ii)証券の売却の申込みあるいは証券購入の勧誘が認めら

れていない地域における当該行為を意図しておらず、かつ(iii)野村グループに関するディスクロージャー以外は、信頼できると判断されるが野

村グループによる独自の確認は行っていない情報源に基づいております。 野村グループに関するディスクロージャー以外は、野村グループは、本資料の正確性、完全性、信頼性、適切性、特定の目的に対する適性、

譲渡可能性を表明あるいは保証いたしません。また、本資料および関連データの利用の結果として行われた行為(あるいは行わないという判

断)に対する責任を負いません。これにより、野村グループによる全ての保証とその他の言質は許容可能な最大の範囲まで免除されます。野

村グループは本情報の利用、誤用あるいは配布に対して一切の責任を負いません。 本資料中の意見または推定値は本資料に記載されている発行日におけるものであり、本資料中の意見および推定値を含め、情報は予告なく

変わることがあります。野村グループは本資料を更新する義務を負いません。本資料中の論評または見解は執筆者のものであり、野村グルー

プ内の他の関係者の見解と一致しない場合があります。お客様は本資料中の助言または推奨が各自の個別の状況に適しているかどうかを検

討する必要があります。また、必要に応じて、税務を含め、専門家の助言を仰ぐことをお勧めいたします。野村グループは税務に関する助言を

提供しておりません。 野村グループ、その執行役、取締役、従業員は、関連法令、規則で認められている範囲内で、本資料中で言及している発行体の証券、商品、

金融商品、またはそれらから派生したオプションやその他のデリバティブ商品、および証券について、自己勘定、委託、その他の形態による取

引、買持ち、売持ち、あるいは売買を行う場合があります。また、野村グループ会社は発行体の金融商品の(英国の適用される規則の意味する

範囲での)マーケットメーカーあるいはリクイディティ・プロバイダーを務める場合があります。マーケットメーカー活動が米国あるいはその他の地

域における諸法令および諸規則に明記された定義に従って行われる場合、発行体の開示資料においてその旨が別途開示されます。 本資料はスタンダード・アンド・プアーズなどの格付け機関による信用格付けを含め、第三者から得た情報を含む場合があります。当該第三者

の書面による事前の許可がない限り、第三者が関わる内容の複製および配布は形態の如何に関わらず禁止されております。第三者である情

報提供者は格付けを含め、いずれの情報の正確性、完全性、適時性あるいは利用可能性を保証しておらず、原因が何であれ、(不注意あるい

は他の理由による)誤りあるいは削除、または当該内容の利用に起因する結果に対する一切の責任を負いません。第三者である情報提供者は、

譲渡可能性あるいは特定の目的または利用への適性の保証を含め(ただしこれに限定されない)、明示的あるいは暗黙の保証を行っていませ

ん。第三者である情報提供者は格付けを含め、提供した情報の利用に関連する直接的、間接的、偶発的、懲罰的、補償的、罰則的、特別ある

いは派生的な損害、費用、経費、弁護料、損失コスト、費用(損失収入または利益、機会コストを含む)に対する責任を負いません。信用格付け

は意見の表明であり、事実または証券の購入、保有、売却の推奨を表明するものではありません。格付けは証券の適合性あるいは投資目的

に対する証券の適合性を扱うものではなく、投資に関する助言として利用することはお控えください。 本資料中に含まれる MSCI から得た情報は MSCI Inc.(「MSCI」)の独占的財産です。MSCI による事前の書面での許可がない限り、当該情報お

よび他の MSCI の知的財産の複製、再配布あるいは指数などのいかなる金融商品の作成における利用は認められません。当該情報は現状の

形で提供されています。利用者は当該情報の利用に関わるすべてのリスクを負います。これにより、MSCI、その関連会社または当該情報の計

算あるいは編集に関与あるいは関係する第三者は当該情報のすべての部分について、独創性、正確性、完全性、譲渡可能性、特定の目的に

対する適性に関する保証を明確に放棄いたします。前述の内容に限定することなく、MSCI、その関連会社、または当該情報の計算あるいは編

Page 216: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

55

集に関与あるいは関係する第三者はいかなる種類の損失に対する責任をいかなる場合にも一切負いません。MSCI および MSCI 指数は MSCI

およびその関連会社のサービス商標です。 Russell/Nomura 日本株インデックスの知的財産権およびその他一切の権利は野村證券株式会社および Frank Russell Company に帰属します。

なお、野村證券株式会社および Frank Russell Company は、当インデックスの正確性、完全性、信頼性、有用性、市場性、商品性および適合性

を保証するものではなく、インデックスの利用者およびその関連会社が当インデックスを用いて行う事業活動・サービスに関し一切責任を負いま

せん。 本資料は投資家のお客様にとって投資判断を下す際の諸要素のうちの一つにすぎないとお考え下さい。また、本資料は、直接・間接を問わず、

投資判断に伴う全てのリスクについて検証あるいは提示しているのではないことをご了解ください。野村グループは、ファンダメンタル分析、定

量分析等、異なるタイプの数々のリサーチ商品を提供しております。また、時間軸の捉え方や分析方法の違い等の理由により、リサーチのタイ

プによって推奨が異なる場合があります。野村グループは野村グループのポータル・サイト上へのリサーチ商品の掲載および/あるいはお客様

への直接的な配布を含め、様々な方法によってリサーチ商品を発表しております。調査部門が個々のお客様の要望に応じて提供する商品およ

びサービスはお客様の属性によって異なる場合があります。 当レポートに記載されている数値は過去のパフォーマンスあるいは過去のパフォーマンスに基づくシミュレーションに言及したものである場合が

あり、将来のパフォーマンスを示唆するものとして信頼できるものではありません。情報に将来のパフォーマンスに関する示唆が含まれている

場合、係る予想は将来のパフォーマンスを示唆するものとして必ずしも信頼できるものではありません。また、シミュレーションはモデルと想定の

簡略化に基づいて行われており、想定が過度に簡略化され、将来のリターン分布を反映していない場合があります。 特定の証券は、その価値または価格、あるいはそこから得られる収益に悪影響を及ぼし得る為替相場変動の影響を受ける場合があります。 金融市場関連のリサーチについて:アナリストによるトレード推奨については、以下の 2 通りに分類されます;戦術的(tactical)トレード推奨は、

向こう 3 ヶ月程度の見通しに基づいています;戦略的(strategic)トレード推奨は、向こう 6 ヶ月から 12 ヶ月の見通しに基づいています。これら推

奨トレードについては、経済・市場環境の変化に応じて、適宜見直しの対象となります。また、ストップ・ロスが明記されたトレードについては、そ

の水準を超えた時点で推奨の対象から自動的に外れます。トレード推奨に明記される金利水準や証券のプライスについては、リサーチ・レポー

トの発行に際してアナリストから提出された時点の、ブルームバーグ、ロイター、野村のいずれかによる気配値であり、その時点で、実際に取引

が可能な水準であるとは限りません。 本資料に記載された証券は米国の 1933 年証券法に基づく登録が行われていない場合があります。係る場合、1933 年証券法に基づく登録が

行われる、あるいは当該登録義務が免除されていない限り、米国内で、または米国人を対象とする購入申込みあるいは売却はできません。準

拠法が他の方法を認めていない限り、いかなる取引もお客様の地域にある野村の関連会社を通じて行う必要があります。 本資料は、NIplc により英国および欧州経済領域内において投資リサーチとして配布することを認められたものです。NIplc は、英国のプルーデ

ンス規制機構によって認可され、英国の金融行為監督機構とプルーデンス規制機構の規制を受けています。NIplc はロンドン証券取引所会員

です。本資料は、英国の適用される規則の意味する範囲での個人的な推奨を成すものではなく、あるいは個々の投資家の特定の投資目的、

財務状況、ニーズを勘案したものではありません。本資料は、英国の適用される規則の目的のために「適格カウンターパーティ」あるいは「専門

的顧客」である投資家のみを対象にしたもので、したがって、当該目的のために「個人顧客」である者への再配布は認められておりません。本

資料は、香港証券先物委員会の監督下にある NIHK によって、香港での配布が認められたものです。本資料は、オーストラリアで ASIC の監督

下にある NAL によってオーストラリアでの配布が認められたものです。また、本資料は NSM によってマレーシアでの配布が認められています。

シンガポールにおいては、本資料は NSL により配布されました。NSL は、証券先物法(第 289 条)で定義されるところの認定投資家、専門的投

資家もしくは機関投資家ではない者に配布する場合、海外関連会社によって発行された証券、先物および為替に関わる本資料の内容について、

法律上の責任を負います。シンガポールにて本資料の配布を受けたお客様は本資料から発生した、もしくは関連する事柄につきましては NSL

にお問い合わせください。本資料は米国においては 1933 年証券法のレギュレーション S の条項で禁止されていない限り、米国登録ブローカ

ー・ディーラーである NSI により配布されます。NSI は 1934 年証券取引所法規則 15a-6 に従い、その内容に対する責任を負っております。本

資料を作成した会社は、野村グループ内の関連会社が、顧客が入手可能な複製を作成することを許可しています。 野村サウジアラビア、NIplc、あるいは他の野村グループ関連会社はサウジアラビア王国(「サウジアラビア」)での(資本市場庁が定めるところ

の、)「オーソライズド・パーソンズ」、「エグゼンプト・パーソンズ」、または「インスティテューションズ」以外の者への本資料の配布、アラブ首長国

連邦(「UAE」)においては、(ドバイ金融サービス機構が定めるところの、)「専門的顧客」以外の者への配布、また、カタール国の(カタール金融

センター規制機構が定めるところの、)「マーケット・カウンターパーティー」、または「ビジネス・カスタマーズ」以外の者への配布を認めておりま

せん。サウジアラビアおいては、「オーソライズド・パーソンズ」、「エグゼンプト・パーソンズ」、または「インスティテューションズ」以外の者、UAE

の「専門的顧客」以外の者、あるいはカタールの「マーケット・カウンターパーティー」、または「ビジネス・カスタマーズ」以外の者を対象に本資料

ならびにそのいかなる複製の作成、配信、配布を行うことは直接・間接を問わず、係る権限を持つ者以外が行うことはできません。本資料を受

け取ることは、サウジアラビアに居住しないか、または「オーソライズド・パーソンズ」、「エグゼンプト・パーソンズ」、または「インスティテューショ

ンズ」であることを意味し、UAE においては「専門的顧客」、カタールにおいては「マーケット・カウンターパーティー」、または「ビジネス・カスタマ

ーズ」であることの表明であり、この規定の順守に同意することを意味いたします。この規定に従わないと、サウジアラビア、UAE、あるいはカタ

ールの法律に違反する行為となる場合があります。

Page 217: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

56

カナダ投資家へのお知らせ:本資料は個人的な推奨ではありません。また投資目的、財務状況、あるいは特定の個人または口座の特定のニー

ズを考慮したものではありません。本資料はオンタリオ証券委員会の NI 31-103 のセクション 8.25 に基づいてお客様へ提供されています。 台湾上場企業に関するレポートおよび台湾所属アナリスト作成のレポートについて:本資料は参考情報の提供だけを目的としています。お客様

ご自身で投資リスクを独自に評価し、投資判断に単独で責任を負っていただく必要があります。本資料のいかなる部分についても、野村グルー

プから事前に書面で承認を得ることなく、報道機関あるいはその他の誰であっても複製あるいは引用することを禁じます。「Operational

Regulations Governing Securities Firms Recommending Trades in Securities to Customer」及びまたはその他の台湾の法令・規則に基づき、お

客様が本資料を関係者、関係会社およびその他の第三者を含む他者へ提供すること、あるいは本資料を用いて利益相反があるかもしれない

活動に従事することを禁じます。NIHK 台湾支店が執行できない証券または商品に関する情報は、情報の提供だけを目的としたものであり、投

資の推奨または勧誘を意図したものではありません。 本資料のいかなる部分についても、野村グループ会社から事前に書面で同意を得ることなく、(i)その形態あるいは方法の如何にかかわらず複

製する、あるいは(ii)配布することを禁じます。本資料が、電子メール等によって電子的に配布された場合には、情報の傍受、変造、紛失、破壊、

あるいは遅延もしくは不完全な状態での受信、またはウィルスへの感染の可能性があることから、安全あるいは誤りがない旨の保証は致しか

ねます。従いまして、送信者は電子的に送信したために発生する可能性のある本資料の内容の誤りあるいは欠落に対する責任を負いません。

確認を必要とされる場合には、印刷された文書をご請求下さい。 日本で求められるディスクレイマー レポート本文中の格付記号の前に※印のある格付けは、金融商品取引法に基づく信用格付業者以外の格付業者が付与した格付け(無登録格

付け)です。無登録格付けについては「無登録格付に関する説明書」https://www.nomura.co.jp/retail/bond/noregistered.html をご参照くださ

い。

当社で取り扱う商品等へのご投資には、各商品等に所定の手数料等(国内株式取引の場合は約定代金に対して最大 1.404%(税込み)(20 万

円以下の場合は、2,808 円(税込み))の売買手数料、投資信託の場合は銘柄ごとに設定された購入時手数料(換金時手数料)および運用管理

費用(信託報酬)等の諸経費、等)をご負担いただく場合があります。また、各商品等には価格の変動等による損失が生じるおそれがあります。

商品ごとに手数料等およびリスクは異なりますので、当該商品等の契約締結前交付書面、上場有価証券等書面、目論見書、等をよくお読みく

ださい。

国内株式(国内 REIT、国内 ETF、国内 ETN を含む)の売買取引には、約定代金に対し最大 1.404%(税込み)(20 万円以下の場合は 2,808 円

(税込み))の売買手数料をいただきます。国内株式を相対取引(募集等を含む)によりご購入いただく場合は、購入対価のみお支払いいただき

ます。ただし、相対取引による売買においても、お客様との合意に基づき、別途手数料をいただくことがあります。国内株式は株価の変動により

損失が生じるおそれがあります。国内 REIT は運用する不動産の価格や収益力の変動により損失が生じるおそれがあります。国内 ETF は連動

する指数等の変動により損失が生じるおそれがあります。

外国株式の売買取引には、売買金額(現地約定金額に現地手数料と税金等を買いの場合には加え、売りの場合には差し引いた額)に対し最

大 1.026%(税込み)(売買代金が 75 万円以下の場合は最大 7,668 円(税込み))の国内売買手数料をいただきます。外国の金融商品市場で

の現地手数料や税金等は国や地域により異なります。外国株式を相対取引(募集等を含む)によりご購入いただく場合は、購入対価のみお支

払いいただきます。ただし、相対取引による売買においても、お客様との合意に基づき、別途手数料をいただくことがあります。外国株式は株価

の変動および為替相場の変動等により損失が生じるおそれがあります。

信用取引には、売買手数料(約定代金に対し最大 1.404%(税込み)(20 万円以下の場合は 2,808 円(税込み)))、管理費および権利処理手数

料をいただきます。加えて、買付の場合、買付代金に対する金利を、売付けの場合、売付け株券等に対する貸株料および品貸料をいただきま

す。委託保証金は、売買代金の 30%以上で、かつ 30 万円以上の額が必要です。信用取引では、委託保証金の約 3.3 倍までのお取引を行うこ

とができるため、株価の変動により委託保証金の額を上回る損失が生じるおそれがあります。詳しくは、上場有価証券等書面、契約締結前交

付書面、等をよくお読みください。

CBの売買取引には、約定代金に対し最大 1.08%(税込み)(4,320 円に満たない場合は 4,320 円(税込み))の売買手数料をいただきます。CB

を相対取引(募集等を含む)によりご購入いただく場合は、購入対価のみお支払いいただきます。ただし、相対取引による売買においても、お客

様との合意に基づき、別途手数料をいただくことがあります。CBは転換もしくは新株予約権の行使対象株式の価格下落や金利変動等によるC

B価格の下落により損失が生じるおそれがあります。加えて、外貨建てCBは、為替相場の変動等により損失が生じるおそれがあります。

債券を募集・売出し等その他、当社との相対取引によってご購入いただく場合は、購入対価のみお支払いいただきます。債券の価格は市場の

金利水準の変化に対応して変動しますので、損失が生じるおそれがあります。また、発行者の経営・財務状況の変化及びそれらに関する外部

評価の変化等により、投資元本を割り込むことがあります。加えて、外貨建て債券は、為替相場の変動等により損失が生じるおそれがあります。

個人向け国債を募集によりご購入いただく場合は、購入対価のみお支払いいただきます。個人向け国債は発行から 1 年間、原則として中途換

金はできません。個人向け国債を中途換金する際、原則として次の算式によって算出される中途換金調整額が、売却される額面金額に経過利

子を加えた金額より差し引かれます。(変動 10 年:直前 2 回分の各利子(税引前)相当額×0.79685、固定 5 年、固定 3 年: 2 回分の各利子

(税引前)相当額×0.79685)

物価連動国債を募集・売出等その他、当社との相対取引によって購入する場合は、購入対価のみをいただきます。当該商品の価格は市場の

金利水準及び全国消費者物価指数の変化に対応して変動しますので、損失が生じるおそれがあります。想定元金額は、全国消費者物価指数

Page 218: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

57

の発行時からの変化率に応じて増減します。利金額は、各利払時の想定元金額に表面利率を乗じて算出します。償還額は、償還時点での想

定元金額となりますが、平成 35 年度以降に償還するもの(第 17 回債以降)については、額面金額を下回りません。

投資信託のお申込み(一部の投資信託はご換金)にあたっては、お申込み金額に対して最大 5.4%(税込み)の購入時手数料(換金時手数料)

をいただきます。また、換金時に直接ご負担いただく費用として、換金時の基準価額に対して最大 2.0%の信託財産留保額をご負担いただく場

合があります。投資信託の保有期間中に間接的にご負担いただく費用として、国内投資信託の場合には、信託財産の純資産総額に対する運

用管理費用(信託報酬)(最大 5.4%(税込み・年率))のほか、運用成績に応じた成功報酬をご負担いただく場合があります。また、その他の費

用を間接的にご負担いただく場合があります。外国投資信託の場合も同様に、運用会社報酬等の名目で、保有期間中に間接的にご負担いた

だく費用があります。

投資信託は、主に国内外の株式や公社債等の値動きのある証券を投資対象とするため、当該資産の市場における取引価格の変動や為替の

変動等により基準価額が変動します。従って損失が生じるおそれがあります。投資信託は、個別の投資信託ごとに、ご負担いただく手数料等の

費用やリスクの内容や性質が異なります。また、上記記載の手数料等の費用の最大値は今後変更される場合がありますので、ご投資にあたっ

ては目論見書や契約締結前交付書面をよくお読みください。

金利スワップ取引、及びドル円ベーシス・スワップ取引(以下、金利スワップ取引等)にあたっては、所定の支払日における所定の「支払金額」の

みお受払いいただきます。金利スワップ取引等には担保を差入れていただく場合があり、取引額は担保の額を超える場合があります。担保の

額は、個別取引により異なりますので、担保の額及び取引の額の担保に対する比率を事前に示すことはできません。金利スワップ取引等は金

利、通貨等の金融市場における相場その他の指標にかかる変動により、損失が生じるおそれがあります。また、上記の金融市場における相場

変動により生じる損失が差入れていただいた担保の額を上回る場合があります。また追加で担保を差入れていただく必要が生じる場合があり

ます。お客様と当社で締結する金利スワップ取引等と「支払金利」(又は「受取金利」)以外の条件を同一とする反対取引を行った場合、当該金

利スワップ取引等の「支払金利」(又は「受取金利」)と、当該反対取引の「受取金利」(又は「支払金利」)とには差があります。商品毎にリスクは

異なりますので、契約締結前交付書面やお客様向け資料をよくお読みください。

クレジット・デフォルト・スワップ(CDS)取引を当社と相対でお取引いただく場合は手数料をいただきません。CDS 取引を行なうにあたっては、弊

社との間で合意した保証金等を担保として差し入れ又は預託していただく場合があり、取引額は保証金等の額を超える場合があります。保証

金等の額は信用度に応じて相対で決定されるため、当該保証金等の額、及び、取引額の当該保証金等の額に対する比率をあらかじめ表示す

ることはできません。CDS 取引は参照組織の一部又は全部の信用状況の変化や、あるいは市場金利の変化によって市場価値が変動し、当該

保証金等の額を超えて損失が生じるおそれがあります。信用事由が発生した場合にスワップの買い手が受取る金額は、信用事由が発生する

までに支払う金額の総額を下回る場合があります。また、スワップの売り手が信用事由が発生した際に支払う金額は、信用事由が発生するま

でに受取った金額の総額を上回る可能性があります。他の条件が同じ場合に、スワップの売りの場合に受取る金額と買いの場合に支払う金額

には差があります。 CDS 取引は、原則として、金融商品取引業者や、あるいは適格機関投資家等の専門的な知識を有するお客様に限定して

お取り扱いしています。

有価証券や金銭のお預かりについては料金をいただきません。証券保管振替機構を通じて他の証券会社へ株式等を移管する場合には、数量

に応じて、移管する銘柄ごとに 10,800 円(税込み)を上限額として移管手数料をいただきます。

野村證券株式会社 金融商品取引業者 関東財務局長(金商) 第 142 号 加入協会/日本証券業協会、一般社団法人 日本投資顧問業協会、一般社団法人 金融先物取引業協会、一般社団法人 第二種金融商品取引

業協会 野村グループは法令順守に関する方針および手続き(利益相反、チャイニーズ・ウォール、守秘義務に関する方針を含むがそれに限定されな

い)やチャイニーズ・ウォールの維持・管理、社員教育を通じてリサーチ資料の作成に関わる相反を管理しています。 本資料で推奨されたトレードについて、その構築に用いられた手法や数理・解析モデルに関する追加情報が必要な場合は、表紙に記載された

アナリストにお問い合わせください。ディスクロージャー情報については下記のサイトをご参照ください。 http://go.nomuranow.com/research/globalresearchportal/pages/disclosures/disclosures.aspx Copyright © 2017 Nomura Securities Co., Ltd. All rights reserved.

Disclosures as of 29-Mar-2017.

Page 219: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

平成28年度

IoT推進のための新産業モデル創出基盤整備事業

(ビッグデータを活用した新指標開発事業)

実証事業報告書

平成29年3月

株式会社エヌ・ティ・ティ・データ

公益財団法人流通経済研究所

Page 220: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

1

<目次>

1. 事業の概要 ............................................................................................. 2

(1) 事業の目的 ............................................................................................................... 2

(2) 実施方法 ................................................................................................................... 2

2. コンテストの概要 .................................................................................. 3

(1) コンテストの進め方 ................................................................................................. 3

(2) コンテスト参加条件 ................................................................................................. 3

(3) 開発する指標............................................................................................................ 3

(4) 指標開発に使用するデータ ...................................................................................... 4

(5) 解析環境 ................................................................................................................... 4

(6) コンテストの開催者 ................................................................................................. 4

3. 参加者の募集 ......................................................................................... 5

(1) 参加者の募集方法 .................................................................................................... 5

(2) 参加者に対するインセンティブ .............................................................................. 7

(3) 募集結果 ................................................................................................................... 7

(4) 本申込み時の提出書類 ............................................................................................. 7

4. 一次審査 ................................................................................................ 8

(1) 一次審査の手順 ........................................................................................................ 8

(2) 企画の特徴 ............................................................................................................... 8

(3) 一次審査における評価項目と審査結果 ................................................................. 10

5. 一次審査から最終報告会までの期間について ..................................... 10

6. 最終報告会 ............................................................................................11

(1) 最終報告会の概要 ................................................................................................... 11

(2) 最終報告会における報告方法 ................................................................................. 11

(3) 評価方法と審査結果 ................................................................................................ 11

(4) 優秀者の研究概要 .................................................................................................. 12

7. コンテストの成果 ................................................................................ 14

(1) コンテスト実施により得られた成果 ..................................................................... 14

(2) 参加者にとっての価値 ........................................................................................... 14

(3) コンテスト運営手順の整理 .................................................................................... 14

8. コンテスト運営における課題と改善の方向 ......................................... 17

(1) コンテスト不参加理由 ........................................................................................... 17

(2) コンテスト参加者のコメント ................................................................................ 17

(3) 外部ネットワークから遮断した解析環境について ............................................... 18

Page 221: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

2

1. 事業の概要

(1) 事業の目的

本事業は、政府等行政機関が保有する統計情報等のデータ、民間企業が保有する商品販

売データ、ブログや Twitter といったソーシャルネットワーキングサービス(SNS)上の書

き込みデータを用いて、新しい経済産業指標を開発することを目的として実施された。

開発された指標は、政府における迅速で正確な判断・政策決定に寄与する他、民間企業

においては迅速で的確な経営判断・意思決定を可能とすることに貢献するものとなる。

(2) 実施方法

本事業では、政府統計等のオープンデータ、商品販売データ(家電量販店の販売データ)、

SNS データ(ブログ、Twitter)を組み合わせて経済産業指標を開発するため、参加者を募

り、コンテスト形式で指標の開発を競う方法を採用した。

コンテストは、3 ステップに分け、以下に示す順で進めた。

各種データをセキュアに取り扱うことが可能な環境の整備

コンテスト参加者の募集、説明会開催、参加にあたっての誓約書の取り交わし

データ解析の実施、解析結果の評価、成果報告会の実施

Page 222: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

3

2. コンテストの概要

(1) コンテストの進め方

本コンテストは、産官学より広く参加者を募り、複数のデータを利用して、新しい経済

産業指標の開発を競うものである。前述の「実施方法」で、②および③に示したステップ

は、以下に示す順で進めた。

参加者の募集(2016年 11月 2日から 2016年 12月 4日まで)

一次審査の実施(2016年 12月 5日)

説明会の開催(2016年 12月 7日)

誓約書の取り交わし(2016年 12月 7日から)

解析環境およびデータの貸与、経済産業指標の開発(2016年 12月 7日から 2017年 2

月 20日まで)

一次審査通過者による中間報告レポートの提出(2017年 1月 23日まで)

最終報告用資料の提出(2017年 2月 20日まで)

最終報告会の実施(2017年 2月 22日)

(2) コンテスト参加条件

本コンテストでは、特に参加条件を設けていない。ただし、データを貸与する企業と直

接的な競業関係にある企業、それに付随するシステム開発会社、調査会社、コンサルティ

ング会社に勤務する方で、データ提供者が参加を許可しない場合には、参加不可とした。

(3) 開発する指標

本コンテストを開催することで開発が期待される新しい経済産業指標として、指標の特

徴から、以下に示す 4 種類を定めた。なお、コンテスト参加希望者には、申込み時に事務

局に提出する「企画提案書」において、開発する指標の種類をいずれか 1 つ選択すること

を求めた。

<開発する指標の種類>

Forecasting指標(将来予測):既存の経済指標に先んじて変動する指標であり、経済

の予測に資するもの

Nowcasting 指標(足元予測):既存の経済指標と同一のものを示しているが、既存指

標よりも早く発表できるもの

新指標:既存の経済指標では捕捉できていない経済や産業の動向等を表現するもの

その他:上記①~③に該当しない指標

Page 223: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

4

(4) 指標開発に使用するデータ

コンテスト参加者が指標を開発するために使用できるデータは、政府統計等、家電量販

店販売データ、SNS データ(ブログデータ、Twitter データ)である。なお、参加者は、政

府統計等、家電量販店販売データ、SNS データ(ブログデータ、Twitter データ)のうち、

2 種類以上を組み合わせて指標を開発する必要がある。

(5) 解析環境

各種の機密データをセキュアに取り扱うために、外部ネットワークから遮断された解析

環境を構築し、解析環境内に機密データを配置して、参加者に提供した。解析環境は、参

加者以外からのアクセス、及び、外部へのデータ持出しができないように対策を実施した。

また、解析環境が外部ネットワークから遮断されているため、事務局においてアプリケー

ションのインストール等の操作の代行、あるいは、インストール等の申請に対する審査と

対応を実施した。

(6) コンテストの開催者

本コンテストは、経済産業省調査統計グループとPwCあらた有限責任監査法人が共催し、

株式会社エヌ・ティ・ティ・データ(以下、NTT データ)と、公益財団法人流通経済研究

所(以下、流通経済研究所)が事務局を務めた。

Page 224: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

5

3. 参加者の募集

(1) 参加者の募集方法

参加希望者は、コンテストの Web サイトにアクセスし、Web エントリー(仮申し込み)

を経て、募集期間内に企画提案書を提出することで、本申込みとなる。コンテストの Web

サイト(トップページ)のイメージを図表 1 に示す。

図表 1 コンテストの Web サイトのイメージ(トップページ)

募集期間は、2016 年 11 月 2 日から 2016 年 12 月 4 日までの約 1 ヶ月間であった。本コ

ンテストへの参加者を募集するために、プレスリリース、学会、ダイレクトメール(E-mail)

等で告知活動を行った。告知活動の概要を以下に記す。

Page 225: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

6

プレスリリースによる告知

NTT データおよび流通経済研究所の Web サイトで、本コンテストの案内をプレスリリー

スとして掲載した。また、メディア(新聞、雑誌など)にプレスリリースを配信した。

学会等での告知

大学や研究機関などに所属する研究者や、シンクタンク等の民間企業でデータ分析を行

う専門家の参加を想定し、学会等の Web サイトやメーリングリストを通じて、学会員に対

してコンテストの案内をした。

一括メール配信による告知

本コンテストに関係すると思われる研究者、企業等を対象に一括メール配信により告知

を行った。

個人への参加依頼

NTT データと流通経済研究所から、大学教員、シンクタンクの研究員、情報サービス企

業の専門家等に対して個別に参加依頼を行った。

その他の告知

「Hadoop/Spark エンタープライズソリューションセミナー 2016(2016 年 11 月 16 日:

秋葉原コンベンションホール)1」における NTT データの講演において、本コンテストに

ついて告知を行った。

1 http://oss.nttdata.co.jp/hadoop/event/201611/index.html

Page 226: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

7

(2) 参加者に対するインセンティブ

コンテストの内容に関心を持った方に、できるだけ多く参加していただけるように、一

次審査通過者、ならびに、最終報告会で優秀な報告をした参加者に与える特典を設けた。

(3) 募集結果

募集期間を通じて、コンテスト Web サイトのアクセス状況は、セッション数は 2,155、

ページビュー数は 6,764 であった。参加募集要項のダウンロード回数は 501 回であり、本

コンテストの詳細情報を把握しようとした方が多くいたことがわかる。

このうち、Web フォームからの申し込み者(仮申し込み者)は 36 名、企画提案書の提出

者(本申込み者)は 15 名であった。なお、仮申し込み者の所属組織は 27 組織であり、大

学などと民間企業が、それぞれ 13 ずつ、その他、役所が 1 となっており、学術界、産業界

の双方から関心が寄せられたことがわかる。

(4) 本申込み時の提出書類

コンテスト参加希望者は、「参加申込書」と「企画提案書」を事務局に提出することで、

本申込みとみなされる。「企画提案書」の記入項目は次の通り。

<企画提案書の記入項目>

1. 作成する指標(①~④から 1 つを選択)

①Forecasting指標(将来予測)

②Nowcasting指標(足元予測)

③新指標

④その他

2. 企画概要

3. 問題意識

4. 企画の意義

5. 企画内容

6. 分析環境の選択

7. 解析環境に追加してほしいツール

Page 227: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

8

4. 一次審査

(1) 一次審査の手順

一次審査は、12 月 5 日の 15 時から 18 時までの 3 時間、流通経済研究所会議室において、

共催者と事務局の立会いのもと、2 名の審査員によって厳正な審査が行われた。一次審査は、

以下の手順で行った。①から⑤は審査員が行い、⑥を事務局で行った。

<一次審査実施手順>

参加申込書と企画提案書の項目ごとに、事業趣旨を考慮して配点を決定

15件の企画提案書から 4件をサンプルとして抽出

サンプル 4件を審査員 2名で採点し、評価の基準を作成

評価基準をもとに残りの 11件を審査員 2名それぞれで採点

審査員 2名の採点を確認し、点数の異なる項目は 2名で協議のうえ点数を決定

審査員の点数を事務局で確認し、100点満点中 50点以上を獲得した 10件を一次審査

通過者として選定

(2) 企画の特徴

一次審査の対象となった 15 件の企画、ならびに、一次審査を通過した 10 件の企画につ

いて、「開発する指標の種類」、「指標の開発に用いるデータの種類」の 2 つの側面から全体

の特徴を確認した。「開発する指標の種類」を図表 2 に、「指標の開発に用いるデータの種

類」を図表 3 に示す。図表 2 より、「新指標」の開発に対する関心が最も高いことがわか

る。また、図表 3 より、「Twitter データ」を用いた指標開発に対する関心が最も高いこと

がわかる。

Page 228: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

9

図表 2 開発する指標の種類

図表 3 指標の開発に用いるデータの種類

企画提案書 一次審査提出数 通過数

(合計:15) (合計:10)

Forecasting指標(将来予測)

既存の経済指標に先んじて変動する指標であり、経済の予測に資するもの

Nowcasting指標(足元予測)

既存の経済指標と同一のものを示しているが、既存指標よりも早く発表できるもの

新指標

既存の経済指標では捕捉できていない経済や産業の動向等を表現するもの

その他

上記1~3に該当しない指標

開発する指標の種類 

1

2

7

04

3

2

1 1

5

9

0

企画提案書 一次審査提出数 通過数

(合計:15) (合計:10)

政府統計等 12 7

家電販売データ 9 5

SNSデータ(ブログデータ、Twitterデータのいずれか) 15 10

3-1 ブログデータ 12 8

3-2 Twitterデータ 14 9

指標の開発に用いるデータ

3

2

1

Page 229: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

10

(3) 一次審査における評価項目と審査結果

一次審査では、参加申込書と企画提案書の項目ごとに、事業趣旨を考慮して配点を決定

した上で、評価基準を設定し、これに基づいて 15 件の企画を審査した。

審査員 2 名が審査を行った結果、100 点満点中 50 点以上を獲得した 10 名が一次審査通

過となり、50 点未満の 5 名は不合格となった。一次審査通過者の所属組織は、大学所属(教

員、学生)が 6 名、民間企業勤務が 4 名であった。

5. 一次審査から最終報告会までの期間について

事務局では一次審査通過者に対して、本コンテストの詳細内容や進め方、注意事項など

を伝えるための説明会を 2016 年 12 月 7 日に開催した。その後、誓約書の取り交わしを経

て、各参加者は 2017 年 2 月 22 日の最終報告会までの期間、指標の開発を行った。

説明会から最終報告会までの約 2 か月は、参加者がそれぞれのスケジュールに則り、各

自が解析を進める期間である。

事務局では、価値のある成果を得るために、年末年始を含む時期に参加者が想定したス

ケジュールから作業の遅れが生じないよう管理する必要があると考え、参加者に中間報告

レポートの作成を課し、2017 年の 1 月 23 日までに提出するよう求めた。

なお、最終報告会の前段階で一次審査通過者のうち 1 名が辞退を表明したため、最終報

告会に参加したのは 9 名となった。

また、一部の参加者においては、最終報告会よりも前に、本コンテストでの研究の成果

を学会等において発表を行いたい旨の要望があった。

事務局では、対外発表の事前申請を受ける際、発表先、発表内容(発表に用いる資料)

を把握したうえで、本要望の是非を検討した。

Page 230: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

11

6. 最終報告会

(1) 最終報告会の概要

一次審査通過者 10 名のうち、途中辞退 1 名を除く 9 名が、最終報告会で開発した指標に

ついて報告を行った。各参加者の報告内容を 4 名の審査員が評価し、優秀者を選定した。

最終報告会は、2017年 2月 22日の 13時~17時、ホテルグランドヒル市ヶ谷で開催された。

最終報告会では一次審査と比べて評価に高度な専門性が求められることや、幅広いアイ

デアに対して公正な評価が必要であることから、審査員の人数を 4 名としている。

(2) 最終報告会における報告方法

各参加者は、事務局が最終報告用の資料(電子ファイル)を格納した報告用 PC を操作し、

会場の前方スクリーンに資料を投影して報告をおこなった。1 人あたりの報告時間は 10 分

であり、報告内容に対する審査員からの質疑の時間を 5 分設けた。

(3) 評価方法と審査結果

事業の趣旨などを考慮し、以下に示す評価の視点から参加者の報告を評価することとし

た。特に、A )、B )、C ) の三点を重視した。

<最終報告会における評価の視点>

A )政府統計としての意義

B )民間企業にとっての有用性

C )算出の正確性

D )分析・算出の技術

E )アイデアの新規性

優秀者の選定は以下の手順で実施した。

<優秀者の選定手順>

各審査員による優秀者の選定

審査員 4名による総合評価

優秀者の選定

最優優秀賞の選定

優秀賞の選定

若手研究奨励賞の選定

審査員は、上記の評価視点を踏まえ、優秀者を 5 名選定し、優秀賞(3 名)と若手研究奨

Page 231: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

12

励賞(2 名)を決定した(最優秀賞は該当なしとなった)。

(4) 優秀者の研究概要

優秀賞 3 名、若手研究奨励賞 2 名の研究概要(目的、問題意識)を紹介する。

1.優秀賞

1-1.チーム代表者 大学准教授

目的

Twitterを利用した既婚女性に対する非労働力人口の予測モデル構築(Forecasting指標)

問題意識

少子高齢化社会において労働人口を維持するには非労働力人口を労働力人口に変える必

要がある。結婚・出産による女性の離職率は高く、その時期の離職率を下げることが重要

である。

1-2.チーム代表者 大学院博士課程

目的

社会ムードから一週間先の購買力を予測する指標の開発(新指標)

問題意識

近年は SNSによって形成される社会ムードの経済への影響が大きくなってきている。SNS

の投稿には購買後のレビューに加え、購買にまでは至らなかった消費者の声といった情報

も含まれており、多くの情報を持ったデータといえる。既存の消費者行動に関する経済指

標は、実際に購買行動を起こした消費者データのみを用いており、社会ムードを反映した

指標は存在しない。

1-3.チーム代表者 大学講師

目的

新しい地域指標である「地域活性度」の定義と活用を議論する。また、POSデータ活用の

可能性と限界を議論する。(新指標)

問題意識

主に大企業や大規模事業のサンプリングデータから推定された住宅/設備投資とGDP

など経済指標統計は、中小企業の売上/事業所数の比率が大きい地方の経済実態との乖離

が大きい傾向がある。また、地域経済の因果を的確に把握することは、国家のGDPの各

構成要素の精度向上につながる。他方で、地域の経済や特性を測る総合指標や相対評価に

欠き、地方行政など事業の目標の妥当性が課題である。

Page 232: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

13

2.若手研究奨励賞

2-1.チーム代表者 民間企業勤務

目的

産業間および産業内の労働力移動をブログ等のデータから定量化した指標の開発(新指

標)

問題意識

キャリアパスの選択肢を把握したい個々の労働者からも、優秀な人材を獲得したい企業

からも、労働力から産業構造を把握したい政府からも、産業間/内の労働力移動を可視化

する有益な指標が望まれていると考えられる。

2-2.チーム代表者 大学院修士課程

目的

消費者の潜在意識を考慮した客観的な重み付けに基づく経済指標の開発(新指標)

問題意識

既存の経済産業指標は、統計調査をもとに厳格な手順で作成されており、信頼のおける

ものであるが、月次で作成される指標が多く、消費者の短期的な動向を捉えきれないとい

う欠点がある。変化の激しい現代において、既存の経済産業指標では考慮されていない消

費者の潜在意識などを考慮することが重要だと考えられる。

Page 233: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

14

7. コンテストの成果

(1) コンテスト実施により得られた成果

本コンテストの主たる成果として、学術界、産業界からの参加者により、オープンデー

タとビッグデータを組み合わせた研究が推進されたことが挙げられる。これは、通常は入

手することが容易ではない家電量販店販売データや SNS データを、事務局が参加者に貸与

するという方法を採用したことで得られた成果であるといえる。また、参加者にとっては、

利用することが容易ではないビッグデータを用いて経済産業指標の開発にチャレンジする

という、コンテストの趣旨そのものが魅力的なものだったと考えられる。

本コンテストの成果としては、各参加者が開発した新しい経済産業指標に関するアイデ

アそのもの、すなわち、指標の意義、指標の定義、算出方法なども挙げられる。本コンテ

ストでは、新しい経済産業指標として採用するというレベルの指標の開発には至らなかっ

たものの、優秀賞および若手研究奨励賞を受賞した研究成果は高い評価を得た。

いずれの指標とも、改善すべき点を含んではいるが、制約のある解析環境で、約 2 ヶ月

という短期間で開発されたものであることを考慮すれば、今後、研究を継続することで、

指標を修正していく余地は十分あると考えられる。実際、多くの参加者は報告において今

後の課題に言及しており、追加分析などに意欲をみせていた。

また、開発された指標に関するアイデアの他、新しい経済産業指標を開発する際の問題

意識や、既存の経済産業指標が有す問題点といった事項も、コンテストの実施を通じて得

られた成果だといえる。

(2) 参加者にとっての価値

参加者にとって、最終報告会における審査員からの質問やコメントは、示唆に富んだも

のが多かったと思われる。また、他の参加者の報告に関心を持ち、研究者間での交流をし

たいと考える参加者もいた。コンテストは他の研究者や実務家との交流のきっかけになり

うるといえる。参加者間だけでなく、データ提供企業の方と参加者の間で情報共有をおこ

なうケースもみられ、参加者の中には共催者や事務局のメンバーとの交流を希望する方も

いた。以上より、参加者にとってコンテストは、様々な分析視点に触れる貴重な機会であ

り、研究を更に発展させるきっかけになりうる貴重な場だといえる。

(3) コンテスト運営手順の整理

本コンテストで得られた成果として、コンテストという形式を実施する上での運営手順

のノウハウが蓄積されたことが挙げられる。本コンテストにおける、参加者の募集から最

終報告会の実施に至るまでの各過程について、主なタスクと留意すべき点を時系列に沿っ

て示す。

Page 234: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

15

参加者の募集

1. 募集期間の決定

2. 参加募集要項の作成

3. Web サイトの構築

4. プレスリリースによる告知

5. 学会等での告知

6. 一括メール配信による告知

7. 参加候補者への直接的な参加依頼

8. 参加者に対する特典

9. Web サイトへのアクセス解析

10. 応募書類の作成

一次審査の実施

1. 審査員の選定

2. 日時、会場の決定

3. 審査方法、審査基準の作成

4. 一次審査の実施

5. 一次審査結果の通知

説明会の開催

1. 日時、会場の決定

2. 説明会用資料の作成

3. 参加者からの想定質問と回答例の準備

4. 誓約書の作成

5. 説明会の開催

6. 欠席者対応

7. 説明会における質問対応と参加者への周知

誓約書の取り交わし

1. 誓約書提出方法の周知

2. 必要に応じて誓約書内容を見直す

Page 235: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

16

解析環境およびデータの貸与、参加者による解析の実施

1. 解析環境の準備

2. 解析環境とデータの貸与

3. 参加者による解析の実施

参加者による中間報告レポートの提出、最終報告用資料の提出

1. 中間報告レポートに関する告知

2. 参加者による中間報告ポートの提出

3. 最終報告用資料に関する告知

4. 参加者による最終報告用資料の提出

最終報告会の実施

1. 審査員の選定

2. 日時、会場の決定

3. 審査方法、審査基準の作成

4. 最終報告会の準備、会場設営

5. 最終報告会の実施

6. 審査の実施

7. 結果発表、表彰

Page 236: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

17

8. コンテスト運営における課題と改善の方向

本コンテストを運営する上で発生した主な課題について記し、これを踏まえて、考えら

れる改善の方向性を示す。

(1) コンテスト不参加理由

参加者の募集に際しては、個別依頼を通じて申し込みいただいた方がいた一方、参加を

見送った方も少なくなかった。そこで、事務局では不参加者へのヒアリングを実施した。

ヒアリングの結果、不参加理由として多く上がった意見は、12 月から翌年 2 月という時

期に、解析のための時間を確保することが難しいということ、分析期間そのものが約 2 ヶ

月間と短いということであった。

今後、同様のコンテスト等を開催する際には、年末年始や年度末を避けるなど、実施時

期を見直し、分析期間を延長することで、より多くの参加を促せると考えられる。

また、申し込み時点で、データについて詳しく知ることができないということや、普段

使用している解析環境を自由に使えないことを不参加理由に挙げる声もあった。

(2) コンテスト参加者のコメント

参加者に、コンテスト終了後に感想などをヒアリングした。コンテスト運営面での課題

に関連するコメントを以下で紹介する。

<解析環境やデータに関するコメント>

解析環境の自由度が重要だと改めて感じた。

解析環境へのデータの持ち込みやインストールを参加者がもう少し自由にでき

るとありがたい。

データ利用の柔軟性を高めてもらえると良い。

持ち出し申請の条件が厳しく、コンテストに割く時間が効率的なものでなかっ

た。

参加者のコメントからは、事務局が貸与した解析環境での作業が、普段の自分自身の解

析環境での作業と勝手が違い、戸惑った様子がうかがえる。寄せられた意見の中で、運営

面での課題に関するコメントは、ほとんどが解析環境やデータに関するものであった。

Page 237: 平成28年度 IoT推進のための新産業モデル創出基盤整備事業 ... · 2020-04-23 · 経済産業省大臣官房調査統計グループ調査分析支援室委託調査

18

(3) 外部ネットワークから遮断した解析環境について

本コンテストでは、事務局が、データ提供企業から機密データを貸与してもらうため、

外部ネットワークから遮断した解析環境を参加者に提供した。これは、機密保持契約に疎

い方も参加する可能性を考えると、不可避の措置であった。

実際に、参加者数名から、禁止していた販売データの持ち出し申請があった。この事実

は、システム的な制約がなければ、解析環境以外に機密データが持ち出されていたことを

示唆しており、外部ネットワークから遮断した解析環境とすることが必須だったといえる。

また、誓約書の取り交わし方についても再考する余地がある。

一方で、解析環境を外部ネットワークから遮断することは、参加者の利便性を損なうと

ともに、事務局の負担を増やすことにもつながる。

上記のような課題を踏まえ、改善の方向性について述べる。

今後、コンテストを実施する際は、「解析環境の自由度が重要」(参加者のコメントより

引用)であることは明白である。できるかぎり参加者の利便性を満たすような解析環境で

作業できるようにすることが、多くの方に参加申し込みをしていただくために、そして、

参加者に普段の実力を十分に発揮していただくために、極めて重要だと言える。ただし、

本コンテストのように、参加者のローカル環境に提供できないレベルの秘密データを扱う

場合は、上記のような参加者の要望を把握していたとしても、対応することは難しかった。

本コンテストの運営を通じて、扱うデータの機密性が高い程、参加者にとって利便性や

自由度が損なわれやすく、事務局の負担も大きくなることがわかった。データ提供企業の

機密性に対する要望を満たしつつ、参加者の利便性を高め(一方では扱えるデータが魅力

的であることも求められる)、事務局の負担を減らすことに同時に対応しなくてはならない。

ひとつの改善方向として、データ提供企業から貸与していただくデータの範囲や粒度等

をある程度限定的にすることで、データの機密性を下げることが挙げられる。

コンテストの参加者を増やすためには、実施時期を見直すこと(年末年始や年度末を避

ける)、分析期間を延長することが有効だと考えられる。例えば、解析期間を本コンテスト

の 2~3 倍に相当する4ヶ月程度の期間を確保することで、大学関係者においても、民間企

業関係者においても、参加しやすくなるであろう。

申し込みの時点で参加者の不安を解消しておくことも重要である。事前に説明会を開き、

コンテストの概要や使用データ、解析環境などについて情報を伝えることで、参加しやす

くなると考えられる。