Upload
untext-methods
View
501
Download
3
Embed Size (px)
Citation preview
営業Group 営業企画支援Team
原口 正くろーどTEL:[email protected]
2015/02/11
公共クラウド Division
ハンズオンBライトニングトーク用スライド
関⻄オープンデータEXPO’15@大阪イノベーションハブ
Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
0.オープンデータについておさらい
2公共クラウド Division 営業Group 営業企画支援Team
Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
オープンデータとは?
(1) 機械判読に適したデータ形式コンピュータが⾃動的にデータを再利⽤するためには、コンピュータが、当該データの論理的な構造を識別
(判読)でき、構造中の値(表の中に⼊っている数値、テキスト等)が処理できるようになっていることが必要となります。機械判読が容易なデータ形式には、いくつかの段階がありますが、画像ファイルやPDF等の形式ですと、コンピュータプログラムがその中のデータを識別することは困難となり、⼆次利⽤をするためには、⼈⼿による再⼊⼒が必要となります。東⽇本⼤震災発⽣時には、⾏政の保有する避難所情報などの震災関連情報を地図データ等を利⽤して広く周知させようとしても、データの形式の問題で⼈⼿によって再⼊⼒しなければならないなど、情報の集約や⼆次利⽤に多くの時間と⼿間が必要とされるケースが散⾒されました。また、機械判読が困難なデータ形式では、スマートフォンのアプリ等で⾃動処理することは非常に困難となり、⺠間による⾃発的な公共サービスの創造は期待しにくいものとなります。
(2) ⼆次利⽤が可能な利⽤ルール⼆次利⽤が可能な利⽤ルールについては、第三者がデータを⼀部改変して利⽤すること、すなわちデータの
⼆次利⽤を、データ所有者が予め許諾していることを明⽰することが必要となります。例えば、著作物には著作権が発⽣しますが、⼆次利⽤を広く認めるには、その著作権の不⾏使を予め宣⾔しておくことが求められます。他⽅、現在の各府省のホームページの利⽤条件を⾒てみると、無断での改変を禁じているものが多く、広く⼆次利⽤を認めるものとはなっていません。また、数値データ等、著作物に該当しないデータについて、著作権の対象であるような包括的な表現となっている場合もあります。
引⽤元:総務省ホームページ『オープンデータと⾔える条件』
総務省ホームページで定義されたオープンデータと⾔える条件。
公共クラウド Division 営業Group 営業企画支援Team 3
Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
オープンデータとは?
『政府や⾃治体のデータを⼆次利⽤可能なオープンライセンスで公開し、
市⺠や企業が誰でも⾃由に利⽤できるデータ』
公共クラウド Division 営業Group 営業企画支援Team 4
Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
データ作成にあたって、考慮すべき点
三原則を満たした、「利用可能」なデータを公開する必要があります。
★ どんな形式でも良いのでデータをオープンライセンスで公開 PDFなど★★ データを構造化データとして公開 Excel、Wordなど★★★ 非独占の形式を使いましょう CSV、TEXTなど★★★★ 物事を示すのにURIを使用し、データにリンクすることを可能に URLのようなもの★★★★★ データのコンテキストを提供するために他のデータへリンク RDF
出展:http://5stardata.info/
公共クラウド Division 営業Group 営業企画支援Team 5
Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
データ作成にあたって、考慮すべき点
(1) 機械判読に適したデータ形式コンピュータが⾃動的にデータを再利用するためには、コンピュータが、当該データの論理的な構造を識別
(判読)でき、構造中の値(表の中に⼊っている数値、テキスト等)が処理できるようになっていることが必要となります。機械判読が容易なデータ形式には、いくつかの段階がありますが、画像ファイルやPDF等の形式ですと、コンピュータプログラムがその中のデータを識別することは困難となり、⼆次利用をするためには、⼈⼿による再⼊⼒が必要となります。東⽇本大震災発⽣時には、⾏政の保有する避難所情報などの震災関連情報を地図データ等を利用して広く周知させようとしても、データの形式の問題で⼈⼿によって再⼊⼒しなければならないなど、情報の集約や⼆次利用に多くの時間と⼿間が必要とされるケースが散⾒されました。また、機械判読が困難なデータ形式では、スマートフォンのアプリ等で⾃動処理することは非常に困難となり、⺠間による⾃発的な公共サービスの創造は期待しにくいものとなります。
引用元:総務省ホームページ『オープンデータと⾔える条件』
データ作成にあたって、再確認すべきこと
データセットのあり方を検討する必要がある
公共クラウド Division 営業Group 営業企画支援Team 6
Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
ここまでは、問題がなかった。。。
7公共クラウド Division 営業Group 営業企画支援Team
Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
ここから、決めないといけない事、いっぱい。
8公共クラウド Division 営業Group 営業企画支援Team
Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
実際に決めなくてはいけないこと達
(1) サイトのドメイン(2) データ利用規約(3) 内部用データ公開ルール(4) アカウントごとの組織/タグのヒモ付(5) データポータルサイトアカウントルール(6) データセットと庁内組織のヒモ付(7) データにひもづけるメタデータ(8) サイトのメンテナンスルール(9) 職員研修のありかた
公共クラウド Division 営業Group 営業企画支援Team 9
他にも、そもそもどんなデータを出すか?どんな形式で提供するか、などなど・・・・
Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
1.オープンデータポータルについて
10公共クラウド Division 営業Group 営業企画支援Team
Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
各サイト分割の意味について
市本体サイト O/Dポータルサイト
情報公開の精神にもとづいて、市⺠向け情報を「⼈が⾒やすい」形式で提供
するサイト
市にストックされている情報を、ニーズに応じて「機会判読可能な」形式で
提供するサイト
2つのサイトは、バナ2つのサイトは、バナーで相互リンク。必要に応じて、それぞれの末端ページをリンク。
・市政情報の即時配信・様式類の取得・情報のアーカイブ・利用者別の情報構造
・統計情報等の時系列・位置情報等の面情報・画像などの素材情報・市⺠要求ごとの情報
配信情報の特徴配信情報の特徴 配信情報の特徴配信情報の特徴
⽇々の更新による定常的状配信・情報公開によって運営
データ要求時、もしくは更新時期ごとの定期的更新
24種類のジャムを売り場に並べたときと、6種類のジャムを売り場に並べたときでは、前者は、後者の売り上げの10分の1しかなかった。
— 「選択の科学(シーナ・アイエンガー)」より
公共クラウド Division 営業Group 営業企画支援Team
市町村本体サイト
11
Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
サイト分割のメリット/デメリット
難問は分割せよ
— 「方法叙説(デカルト)」より
統合サイトの場合統合サイトの場合統合サイトの場合統合サイトの場合 分割サイトの場合分割サイトの場合分割サイトの場合分割サイトの場合
両サイトとも閲覧不能になる恐れがありま
す
アクセス集中への強度は?
双方のサイトについての影響は少なく、ス
ムーズにデータ習得が可能
データのみ、あるいはページのみの検索を
実施するには問題があります
サイト内検索の利便性は?
必要なデータを、組織、グループ、タグの3
軸で次週に検索が可能です
サイト内に掲載していることなどから、別途
別ページやコンテンツを作るなどして管理
する必要があります
データの網羅性は? 専用サイトして運用するため、よりコンパク
トに検索性の高い運用が可能です
1サイトで管理でき、相対的に平易。運用上
データの仕分け等が発生するため、1デー
タの2重掲載が前提となる可能性が高い
運⽤負荷は?2サイトをそれぞれ管理する必要あり、2つ
の運用ルールが必要。
オープンデータ専門サイトのため、データ
の仕分け等は不要となり、管理は容易。
CMSサービスに依存して決定。
データ配信などへの転用は高コストの畏れ
将来の拡張は? APIによる配信なども前提に設計しており、
データ利用を容易にする仕組みとして構築
いけてない 雰囲気的に? いけてる
公共クラウド Division 営業Group 営業企画支援Team 12
Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
ここまでも、まだ、問題がなかった。。。
13公共クラウド Division 営業Group 営業企画支援Team
Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
2.想定運用フローについて
14公共クラウド Division 営業Group 営業企画支援Team
Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
運用フロー作成前に決定しなくてはいけない事項
どうでもよいことは流⾏に従い、重大なことは道徳に従い、芸術のことは⾃分に従う。
— 小津 安⼆郎
公共クラウド Division 営業Group 営業企画支援Team
公開データの洗い出し公開データの洗い出し市が持っている各種の⾏政データから、特にオープンデータとして公開対象になりうるものをリストアップし、各担当部局に対して提供を依頼する。
データ提供の利用ルールデータ提供の利用ルール公開するそれぞれのオープンデータに対して、その改変や著作権の及ぶ範囲など、適用すべき利用ルールを選定する。
データセット・組織扱いデータセット・組織扱い公開・非公開の制御はデータセットご指定され、非公開のものは、データセットが属する組織に所属するユーザのみが閲覧できる。組織とデータセットを公開対象のデータセットごとにまとめる。
データの登録・管理規則データの登録・管理規則データを登録する担当者とその⼿順を明確にし、規則として明文化する。アカウントの発⾏申請⼿順や、データの登録承認⼿続きを決定。また、組織ごとに、管理者ユーザを定める。
グループやタグの決定グループやタグの決定
グループやタグは、利便性を向上させるための項目である。グループやタグとして何を設定するか、また、各オープンデータをどのグループやタグに所属させるかを決定する。
そもそもの公開に関わる箇所そもそもの公開に関わる箇所
公開後の運用及び担当の業務に関わる箇所公開後の運用及び担当の業務に関わる箇所
参考:オープンデータ流通推進コンソーシアム「オープンデータガイド〜オープンデータのためのルール・技術の⼿引き〜第1版」付録 11章
15
Copyright 2015 Smartvalue Co.,Ltd All rights reserved. 16
想定運用フローについて
公共クラウド Division 営業Group 営業企画支援Team
公
開
内部の運用外部からの要因
データ公開のの是非を判断
データサイトへのデータ登録
非掲載の連絡市⺠/企業/政府
からの声確認と承認
データの作成
必要に応じて協議
デ
タ登録の
デ
ータ登録の
起案
公開記録の保管
公開情報の更新
データ要求から公開までの流れ
凡例凡例市⺠(外部)
要求
管理部門の必要作業
原課での必要作業
掲載可の判断
Copyright 2015 Smartvalue Co.,Ltd All rights reserved. 17
⾏政にかかるコストの課題を解決するために
規矩作法守りつくして、破るとも、離るるとても、本を忘れるな。
— 千利休
ポータルサイトへの情報登録フローは6ステップポータルサイトへの情報登録フローは6ステップ
必要に応じリンク付与公開タグ付与グループ
付与データ
アップロードログイン
使⽤するツール例CKAN
いくくるウェブなど
データ更新作業に掛かるステップは、CMS作業同等データ更新作業に掛かるステップは、CMS作業同等既に多くの⾃治体様で導⼊されているCMSによる通常のホームページ更新フローと同様、もしくはあいのりする形での運用体制の敷設が可能です。
=+
既存の業務フローへと歩み寄る形でのデータ公開フローを早期に確⽴してしまうことが最重要課題
公共クラウド Division 営業Group 営業企画支援Team
市町村本体サイト
Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
これが、なかなか難しい。。
18公共クラウド Division 営業Group 営業企画支援Team
Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
3.データ作成ルールについて
19公共クラウド Division 営業Group 営業企画支援Team
Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
オープンデータ化【表形式データに関する指針】
①1つのファイル=1種類の表で構成する→1つのファイルに複数の表がある場合は、分割して2つのファイルにする。
②表のヘッダ(項目名)は1⾏で構成する→ヘッダ(項目名)の内容を統合して1⾏にまとめる。
③データ以外の情報は記⼊しない→データへの注釈は省く。
④セル同士の結合はしない→1⾏単位でのデータであるため、結合は禁⽌。
⑤データの値がない場合を除き、セルは空⽩(省略)にしない→データの値がない場合は、空⽩にする。
⑥年の値は、⻄暦表記を記⼊する→和暦のみでなく、⻄暦も記⼊する
⑦データの単位(物理単位や貨幣単位等)はヘッダ(項目名)に記⼊する→各データのセルに単位を記⼊はしない
参考:オープンデータ流通推進コンソーシアム「オープンデータガイド〜オープンデータのためのルール・技術の⼿引き〜第1版」p.96-106
公共クラウド Division 営業Group 営業企画支援Team 20
Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
【オープンデータ化されたCSVデータのタグ定義】■基本情報 →施設に関する基本情報で、記⼊必須項目です。
・施設名:施設の名称・郵便番号:施設の郵便番号(ハイフンあり)・住所:施設の住所とは別に、「府」「市」「区」のカテゴリ分けも
→アプリの施設検索時に活用されやすくなります。・電話番号:施設の電話番号(ハイフンあり)・FAX番号:施設のFAX番号(ハイフンあり)・緯度:施設の緯度・経度:施設の経度・ホームページURL:施設の公式ホームページ
■付帯情報 →施設に関する付帯情報で、記⼊は必須ではありません。・施設情報:施設に関する説明・カテゴリ:施設のカテゴライズ・画像URL:施設に関する写真・サムネイル画像URL:サムネイル用の施設の写真・創設⽇:施設の創設⽇・創設者:施設の創設者
■その他情報 →データセットの内容によって変更される情報です。・営業開始時間 ・営業終了時間 ・対象年齢 ・定員 など
施設情報テンプレート
公共クラウド Division 営業Group 営業企画支援Team 21
Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
【テンプレート⾒本】■Excelデータ →編集時はこちらから。
■CSVデータ →保存時はCSV形式で。
例えば、施設情報テンプレート
基本情報(記⼊必須) 付帯情報 その他の情報
基本情報(記⼊必須) 付帯情報 その他の情報
公共クラウド Division 営業Group 営業企画支援Team 22
Copyright 2015 Smartvalue Co.,Ltd All rights reserved. 23
データ公開にあたり、整備すべきルール
公共クラウド Division 営業Group 営業企画支援Team
既存の情報発信業務と同様に、一定のルールの決定が必要です
データ公開にあたり、その位置づけや利用に関する規約を制定し、データポータルサイトへ併せて掲出する必要があります
通常のホームページ更新等と同様に、「どこの」「どのような」責任のもとにデータを公開するのかの⼿順を決定する必要があります
通常のホームページ運用と同様に、各データの更新にあたっての権限の付与及びその権限の付与範囲の管理が必要です
データ利用規約 データ運用ルール アカウント管理
『オープンデータ流通推進コンソーシアム「オープンデータガイド〜オープンデータのためのルール・技術の⼿引き〜第1版」P57 』を参照の上、必要な情報などを検討下さい。
データの作成・更新は通常の場合、原課での対応が望ましいと思われます。サイト運用時に設定されたルールなどを基本に、所管課及び管理部門との役割分担をご設定下さい。
ポータルサイト用のアカウントの払い出し及びその管理について、管理を担当する部門の実態に沿った形でご決定下さい。データ所管課ごとに2つ程度のアカウント発⾏と、年度ごとのPW変更程度での開始が望ましいと思われます。
Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
これが、なかなか難しい。。
24公共クラウド Division 営業Group 営業企画支援Team
Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
4.データ作成ルールについて-具体例
25公共クラウド Division 営業Group 営業企画支援Team
Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
オープンデータ化
公共クラウド Division 営業Group 営業企画支援Team
表形式データに関する指針
1つのファイル=1種類の表で構成する 1つのファイルに複数の表がある場合は、分割して2つのファイルにする。
表のヘッダ(項目名)は1⾏で構成する ヘッダ(項目名)の内容を統合して1⾏にまとめる
データ以外の情報は記⼊しない データへの注釈は省く
セル同士の結合はしない 1⾏単位でのデータであるため、結合は禁⽌
データの値がない場合を除き、セルは空⽩(省略)にしない データの値がない場合は、空⽩にする
年の値は、⻄暦表記を記⼊する 和暦のみでなく、⻄暦も記⼊する
データの単位(物理単位や貨幣単位等)はヘッダ(項目名)に記⼊する 各データのセルに単位を記⼊はしない
①
②
③
④
⑤
⑥
⑦参考:オープンデータ流通推進コンソーシアム「オープンデータガイド〜オープンデータのためのルール・技術の⼿引き〜第1版」p.96-106
26
Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
オープンデータ化に向けた作業での実際
公共クラウド Division 営業Group 営業企画支援Team
今回頂いたデータにおける問題点の例
27
1つのファイル=1種類の表で構成する1つのファイルに複数の表がある場合は、分割して2つのファイルにする。
①
セル同士の結合はしない1⾏単位でのデータであるため、結合は禁⽌。
④
データの単位(物理単位や貨幣単位等)はヘッダ(項目名)に記⼊する
各データのセルに単位を記⼊はしない
⑦
学校名
電話番号等
住所等
施設名称
施設名称など施設名称など
施設名称など施設名称など
Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
・施設名:施設の名称・郵便番号:施設の郵便番号・住所:施設の住所とは別に、「府」「市」「区」のカテゴリ分けも→アプリの施設検索時に活用されやすくなります。・電話番号:施設の電話番号・FAX番号:施設のFAX番号・緯度:施設の緯度・経度:施設の経度・ホームページURL:施設の公式ホームページ
・施設情報:施設に関する説明・カテゴリ:施設のカテゴライズ・画像URL:施設に関する写真・サムネイル画像URL:サムネイル用の施設の写真・創設⽇:施設の創設⽇・創設者:施設の創設者
営業開始時間・営業終了時間・対象年齢・定員など
データ公開時に使用するテンプレート案
公共クラウド Division 営業Group 営業企画支援Team
オープンデータ化された施設情報のCSVデータのタグ定義
基本情報 付帯情報 その他
施設に関する基本情報で、記⼊必須項目です。また、アプリなどに活用した際、施設検索など基本機能に関わるデータ群です。
施設に関する付帯情報で、記⼊は必須ではありませんが、データとしては保持しておいた方が利活用の幅が広がるデータです。
データセットの内容によって変更される情報です。公開するデータセットに応じて⾃由に設定いただくことを想定しています。
28
Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
施設情報テンプレート
公共クラウド Division 営業Group 営業企画支援Team
施設に関する基本情報で、記⼊必須項目です 施設に関する付帯情報で、記⼊は必須ではありません
データセットの内容によって変更される情報です
基本情報基本情報 付帯情報付帯情報 その他その他
テンプレート⾒本にみる対応
データ作成時におけるExcelの表記データ作成時におけるExcelの表記
公開時には、CSV形式にて保存します
基本情報基本情報 付帯情報付帯情報 その他その他
データ作成ルールに注意し、保存時に形式を指定するだけ
29
Copyright 2015 Smartvalue Co.,Ltd All rights reserved. 30公共クラウド Division 営業Group 営業企画支援Team
その他の留意点など
メタデータの表記
表記すべき内容・タイトル・組織名・公表者(部局)・作成者・更新頻度・タグ・リリース⽇・URL・ファイルサイズ・最終更新⽇・使用⾔語・補足
データの作成・更新は通常の場合、原課での対応が望ましいと思われます。また、公開されたデータに関する問合せの一次窓口や、データ以外の公開情報に関しての更新責任のある部署を決定する必要があります。
通常のサイトの更新作業同様のプロセスに加え、新たに、データの作成プロセスが業務に加わります。市⺠や企業などの求めてに応じて提供するデータの作成ルールの徹底のためにも、職員研修を⾏い、「オープンデータとは」の部分からの啓蒙が必要です。また、新たに導⼊されるサイト管理のシステムについても同様で、運用のフローについての研修が必要となります。
データに付帯する情報やルールなどの整備
メタデータ サイトのメンテナンス 職員への研修等
公開されたデータについて「⼈がみてどのようなデータかわかる」ための情報の記述方法については、運用ルールとしてご決定頂く必要があります
オープンデータ公開の意義を職員間で正しく共有した上で、業務としての管理、義務としてのデータ公開のルールを策定する必要があります
業務としての管理、義務としてのデータ公開のルールを確認し、研修の上、年度ごとに更新していく必要があります。
Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
庁内調整が多く、実際に進めるとなると、
説得し続けるタフさが必要
31公共クラウド Division 営業Group 営業企画支援Team
Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
補足:CKANについて
32公共クラウド Division 営業Group 営業企画支援Team
Copyright 2015 Smartvalue Co.,Ltd All rights reserved.
CKANについての概説
CKANとは
CKAN は、Web ベースのデータ管理・配信システムであり、Open Knowledge Foundationにより無償で提供されている。
CKANは、data.gov (米国)、data.gov.uk (英国)、publicdata.eu (EU)、data.gov.au (オーストラリア)、DATA.GO.JP(政府データカタログサイト試⾏版)、datameti.go.jp (Open DATA METI)等、オープンデータを配信する多くの政府系組織で利用されている。
詳細は「オープンデータガイド〜オープンデータのためのルール・技術の⼿引き〜第1版」付録 11章を参照(別紙)のこと。、
参考:オープンデータ流通推進コンソーシアム「オープンデータガイド〜オープンデータのためのルール・技術の⼿引き〜第1版」付録 11章
CKANを用いたデータ公開にあたってのフローCKANを用いたデータ公開にあたってのフロー
データセットの登録
データセットの作成
組織へのアカウント連結と通知
管理者による組織の登録
管理者による管理者によるユーザアカウント
登録 データの公開
管理
ユーザ
(職員)
初回及び年度管理のみの作業
⽇常の運用においての作業
33公共クラウド Division 営業Group 営業企画支援Team