27
災災災災災災災災災 災災災災災災災災 災災 @i2k

災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)

Embed Size (px)

Citation preview

Page 1: 災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)

災害と知識インフラ

国立情報学研究所大向 一輝

@i2k

Page 2: 災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)

自己紹介

•コンテンツ科学研究系・准教授

• セマンティックウェブ・ソーシャルメディア

• オープンデータ

•コンテンツシステム開発室長

• CiNii Articles / Books

•1977 年京都生まれ

• 1995 年 1 月@京都( 17 歳)

• 2011 年 3 月@東京( 33 歳)

Page 3: 災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)

国立情報学研究所( NII )

情報学に関するわが国唯一の総合研究所

学術コミュニティ全体のコンテンツ基盤

1976  東京大学情報図書館学研究センター1983  東京大学文献情報センター1986  文部省学術情報センター2000  国立情報学研究所

Page 4: 災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)

NII の知識インフラ

論文   CiNii Articles   NII-ELS / REO

図書・雑誌   CiNii Books   NACSIS-CAT

報告書   KAKEN

研究資料   JAIRO   JAIRO Cloud / IR

Page 5: 災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)

知識インフラ

•知識は失われる

• 壊れる

• 物理的損壊・エラー

• 読めなくなる

• 記録メディアのライフサイクル

• ソフトウェアのライフサイクル

• 意味がわからなくなる

• 社会のライフサイクル

•「データの保存」とは

• コピー?バックアップ?

• 使い続けること

Page 6: 災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)

知識インフラ

•知識の循環を支える

• 収集する

• コピー・アクセス

• 活用・創造する

• 組み合わせ・変換

• 公開・発信する

• 次の収集につなげる

•知識インフラの役割

• 時間・空間を超えて使われ続けるようにすること

• 未知の誰か・未知の用途のため

• オープンかつ共通の基盤が必要

共有

収集

活用創造

公開発信

Page 7: 災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)

CiNii とは•国内最大級の学術情報サービス

• デジタル化された論文: 400 万件

• 書誌情報・リンク: 1500 万件

• 国立国会図書館

• 科学技術振興機構

• 各大学・研究機関

• 検索機能

• 書誌表示機能

• ダウンロード機能

• 同定・統合処理

Page 8: 災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)

CiNii のオープン化

•2005.4 サービス公開

•2006.12 書誌情報のオープン化

•2007.4 Google / Google Scholar 連携

•2009.4 大規模リニューアル・ウェブ API

•2010.4 著者 ID ・著者検索

•2010.11 Yahoo! 連携

•2011.11 CiNii Books 公開

Page 9: 災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)

アクセス推移

2 億アクセス / 年

Page 10: 災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)

CiNii の 3.11

•国立情報学研究所

• 東京都千代田区:震度 5 強

• 被害なし(帰宅困難あり)

•千葉分館(データセンター)

• 千葉県稲毛区:震度 5 弱

• 被害なし・通常運用

• サーバラックは免震台に設置

•アクセス数は 30% ダウン

•( 3/12 は大阪で講演会)

Page 11: 災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)

計画停電

国立情報学研究所千葉分館

Page 12: 災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)

計画停電への対応

•2011/3/14 〜 2011/3/28

• 1回あたり最長 3 時間 40 分

• 7回実施

•システムの立ち上げ・停止作業は 2 時間

• サーバ・ストレージ・スイッチ・ロードバランサ…

• 遠隔地・委託作業

• 早朝・夜の停電時には停止時間を長く取る必要あり

•非常用ディーゼル発電機

• 燃料は 8 時間分のみ

• 補充の見通しなし

• 突発的な停電の可能性も

Page 13: 災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)

CiNii のサーバ構成

CiNiiAP サーバ

CiNiiWeb サーバ

CiNiiAP サーバ

CiNiiWeb サーバ

検索サーバ (1 セット目 )

ciap01

ciw01

ciap02

ciw02

検索サーバ (2 セット目 )

検索サーバ (3 セット目 )

横断検索API①

横断検索API②

横断検索API③

CiNii業務サーバ 各種ログデータ

PostgreSQL PostgreSQL

CiNiiAP サーバ

PostgreSQL

ciap03

↓待機系

cics01

cics02

cics03

cis11 cis12 cis13 cis21 cis22 cis23 cis31 cis32 cis33

cimgr

Page 14: 災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)

3/13 〜 3/19 の運用情報

Page 15: 災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)

3/20 〜 3/26 の運用情報

Page 16: 災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)

情報共有の課題

•計画停電のスケジュール変更をいち早く知りたい

• サービスの品質=運用時間

• 東京電力からの連絡

• ニュース速報

• 千葉市役所のウェブサイト

•運用時間の情報をユーザにどう知らせるか

• 図書館へのメール

• ブログ

• Twitter

• 当時 6000 フォロワー

Page 17: 災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)

運用情報ブログ

Page 18: 災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)

根本的な対応の必要性

•1週間が過ぎると風向きが変わる

• ユーザ・現場の反応

•中期的な計画停電スケジュールの発表( 5 月〜 6 月)

• 対症療法を続けることの困難さ

•システムの再設計・移設の検討

• 作業日数

• 物流の問題

• 新サービスの早期リリース

Page 19: 災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)

定常運用へ

•外部要因の変化

• 電力の需給見通しにめど

• 計画停電のキャンセル

• 4 月以降は原則実施せず

• 燃料の確保

•内部要因は解決せず

• 何ができたのだろうか?

Page 20: 災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)

知識インフラを支える技術

•レイヤー構造

• ユーザインターフェイス

• フロントエンド(アプリケーション)

• ミドルウェア(データベース・検索エンジン)

• バックエンド( OS ・ハイパーバイザ)

• ハードウェア(サーバ・ストレージ)

• ネットワーク(スイッチ・ルータ)

• ファシリティ(空調・建屋)

• 電力(発電所・送電路)

•下位レイヤーを意識することは少ないが…

Page 21: 災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)

知識インフラのリスク管理

•クラウド・商用データセンターの利用は有効か?

•多くの情報システムが平常通り動いていたのは計画停電対象外の地域にあったから

• リスクの外部化=解決ではない

•拠点が 1 つしかないことがリスクの本質

• ディザスタリカバリー: DR

• Business Continuity Plan : BCP

• 災害の存在を前提としたリスク管理

Page 22: 災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)

複数化・分散化

•超大規模ウェブサービスでは実現済み

• 世界のどこからでも短時間のレスポンスを実現するため

•コスト

• 公的機関として費用の n倍増は許されない

•分散処理の難しさ

• 同期の問題

•何を守るのか

• サービスを続けたいのかデータを守りたいのか

• コミュニティの意思決定が必要

Page 23: 災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)

知識インフラの BCP

•ポータビリティの向上

• 小型化

• 需要予測を精密化

• 技術革新の波に乗る

• 必要最小限のサーバ構成

• 仮想化

• ハードウェア間を移動可能に

• クラウドでの運用可

• ワークフローの整備

• 全自動化へ

Page 24: 災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)

CiNii のサーバ構成( 2013 )

24

CiNiiWeb サーバ

CiNiiWeb サーバ

CiNiiWeb サーバ

CiNii AP サーバ 1

検索エンジン(BizSearch)

CiNii 検索サーバ 1(1) CiNii 検索サーバ 1(2)

検索エンジン( Solr )

CiNii 検索サーバ 2(1)

検索エンジン(BizSearch)

検索エンジン( Solr )

CiNii 検索サーバ 2(2)

静的ファイル

本文提供認証課金 Detail

Search

本文呼出( Lognavi )

pgpoolPostgreSQL

CiNii AP サーバ 2

本文提供認証課金 Detail

Search

本文呼出( Lognavi )

pgpoolPostgreSQL

NAS ストレージ

本文 PDF

CiNii 検索サーバ 3

検索エンジン(BizSearch)

CiNii 検索サーバ 4

検索エンジン(Solr)

CiNiiインデキシング

インデキシングサーバCiNii業務サーバ

各種ログデータ

サムネイル作成ディレクトリ作成

Page 25: 災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)

知識インフラの BCP

•アーカイブ

• いつでもデータを使えるようにしておくこと

• 国際連携によるデータ共有・バックアップ

• オープンデータ(データの常時公開)

•コミュニティ

• CiNii の担当は 4人

• 情報をどのように伝えるか

• 例:サービス停止( 11 月 22日 17 時〜 25日 9 時)

• 状況の共有・代替案の提示

Page 26: 災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)

社会の中の知識インフラ

•平常時

• 「知りたい」「生み出したい」を支援する

• 研究・教育・イノベーションの基盤

•緊急時

• 間接支援の手段のひとつ

• 論文情報の一時無料化プラン

• ビジネスとの線引き

• 継続的な議論が不可欠

Page 27: 災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)

まとめ

•知識を守り、使い続けるための工学

• 知識インフラのレイヤー構造

• いま何ができるのか(できないのか)を知る

• 次の災害は地震か?

•社会の中の知識、社会の中の工学

• ユーザやコミュニティを巻き込む

• 情報を伝え、意義を伝える

•専門知識と「つなげる力」の必要性