Upload
ikki-ohmukai
View
546
Download
1
Embed Size (px)
Citation preview
災害と知識インフラ
国立情報学研究所大向 一輝
@i2k
自己紹介
•コンテンツ科学研究系・准教授
• セマンティックウェブ・ソーシャルメディア
• オープンデータ
•コンテンツシステム開発室長
• CiNii Articles / Books
•1977 年京都生まれ
• 1995 年 1 月@京都( 17 歳)
• 2011 年 3 月@東京( 33 歳)
国立情報学研究所( NII )
情報学に関するわが国唯一の総合研究所
学術コミュニティ全体のコンテンツ基盤
1976 東京大学情報図書館学研究センター1983 東京大学文献情報センター1986 文部省学術情報センター2000 国立情報学研究所
NII の知識インフラ
論文 CiNii Articles NII-ELS / REO
図書・雑誌 CiNii Books NACSIS-CAT
報告書 KAKEN
研究資料 JAIRO JAIRO Cloud / IR
知識インフラ
•知識は失われる
• 壊れる
• 物理的損壊・エラー
• 読めなくなる
• 記録メディアのライフサイクル
• ソフトウェアのライフサイクル
• 意味がわからなくなる
• 社会のライフサイクル
•「データの保存」とは
• コピー?バックアップ?
• 使い続けること
知識インフラ
•知識の循環を支える
• 収集する
• コピー・アクセス
• 活用・創造する
• 組み合わせ・変換
• 公開・発信する
• 次の収集につなげる
•知識インフラの役割
• 時間・空間を超えて使われ続けるようにすること
• 未知の誰か・未知の用途のため
• オープンかつ共通の基盤が必要
共有
収集
活用創造
公開発信
CiNii とは•国内最大級の学術情報サービス
• デジタル化された論文: 400 万件
• 書誌情報・リンク: 1500 万件
• 国立国会図書館
• 科学技術振興機構
• 各大学・研究機関
• 検索機能
• 書誌表示機能
• ダウンロード機能
• 同定・統合処理
CiNii のオープン化
•2005.4 サービス公開
•2006.12 書誌情報のオープン化
•2007.4 Google / Google Scholar 連携
•2009.4 大規模リニューアル・ウェブ API
•2010.4 著者 ID ・著者検索
•2010.11 Yahoo! 連携
•2011.11 CiNii Books 公開
アクセス推移
2 億アクセス / 年
CiNii の 3.11
•国立情報学研究所
• 東京都千代田区:震度 5 強
• 被害なし(帰宅困難あり)
•千葉分館(データセンター)
• 千葉県稲毛区:震度 5 弱
• 被害なし・通常運用
• サーバラックは免震台に設置
•アクセス数は 30% ダウン
•( 3/12 は大阪で講演会)
計画停電
国立情報学研究所千葉分館
計画停電への対応
•2011/3/14 〜 2011/3/28
• 1回あたり最長 3 時間 40 分
• 7回実施
•システムの立ち上げ・停止作業は 2 時間
• サーバ・ストレージ・スイッチ・ロードバランサ…
• 遠隔地・委託作業
• 早朝・夜の停電時には停止時間を長く取る必要あり
•非常用ディーゼル発電機
• 燃料は 8 時間分のみ
• 補充の見通しなし
• 突発的な停電の可能性も
CiNii のサーバ構成
CiNiiAP サーバ
CiNiiWeb サーバ
CiNiiAP サーバ
CiNiiWeb サーバ
検索サーバ (1 セット目 )
ciap01
ciw01
ciap02
ciw02
検索サーバ (2 セット目 )
検索サーバ (3 セット目 )
横断検索API①
横断検索API②
横断検索API③
CiNii業務サーバ 各種ログデータ
PostgreSQL PostgreSQL
CiNiiAP サーバ
PostgreSQL
ciap03
↓待機系
cics01
cics02
cics03
cis11 cis12 cis13 cis21 cis22 cis23 cis31 cis32 cis33
cimgr
3/13 〜 3/19 の運用情報
3/20 〜 3/26 の運用情報
情報共有の課題
•計画停電のスケジュール変更をいち早く知りたい
• サービスの品質=運用時間
• 東京電力からの連絡
• ニュース速報
• 千葉市役所のウェブサイト
•運用時間の情報をユーザにどう知らせるか
• 図書館へのメール
• ブログ
• 当時 6000 フォロワー
運用情報ブログ
根本的な対応の必要性
•1週間が過ぎると風向きが変わる
• ユーザ・現場の反応
•中期的な計画停電スケジュールの発表( 5 月〜 6 月)
• 対症療法を続けることの困難さ
•システムの再設計・移設の検討
• 作業日数
• 物流の問題
• 新サービスの早期リリース
定常運用へ
•外部要因の変化
• 電力の需給見通しにめど
• 計画停電のキャンセル
• 4 月以降は原則実施せず
• 燃料の確保
•内部要因は解決せず
• 何ができたのだろうか?
知識インフラを支える技術
•レイヤー構造
• ユーザインターフェイス
• フロントエンド(アプリケーション)
• ミドルウェア(データベース・検索エンジン)
• バックエンド( OS ・ハイパーバイザ)
• ハードウェア(サーバ・ストレージ)
• ネットワーク(スイッチ・ルータ)
• ファシリティ(空調・建屋)
• 電力(発電所・送電路)
•下位レイヤーを意識することは少ないが…
知識インフラのリスク管理
•クラウド・商用データセンターの利用は有効か?
•多くの情報システムが平常通り動いていたのは計画停電対象外の地域にあったから
• リスクの外部化=解決ではない
•拠点が 1 つしかないことがリスクの本質
• ディザスタリカバリー: DR
• Business Continuity Plan : BCP
• 災害の存在を前提としたリスク管理
複数化・分散化
•超大規模ウェブサービスでは実現済み
• 世界のどこからでも短時間のレスポンスを実現するため
•コスト
• 公的機関として費用の n倍増は許されない
•分散処理の難しさ
• 同期の問題
•何を守るのか
• サービスを続けたいのかデータを守りたいのか
• コミュニティの意思決定が必要
知識インフラの BCP
•ポータビリティの向上
• 小型化
• 需要予測を精密化
• 技術革新の波に乗る
• 必要最小限のサーバ構成
• 仮想化
• ハードウェア間を移動可能に
• クラウドでの運用可
• ワークフローの整備
• 全自動化へ
CiNii のサーバ構成( 2013 )
24
CiNiiWeb サーバ
CiNiiWeb サーバ
CiNiiWeb サーバ
CiNii AP サーバ 1
検索エンジン(BizSearch)
CiNii 検索サーバ 1(1) CiNii 検索サーバ 1(2)
検索エンジン( Solr )
CiNii 検索サーバ 2(1)
検索エンジン(BizSearch)
検索エンジン( Solr )
CiNii 検索サーバ 2(2)
静的ファイル
本文提供認証課金 Detail
Search
本文呼出( Lognavi )
pgpoolPostgreSQL
CiNii AP サーバ 2
本文提供認証課金 Detail
Search
本文呼出( Lognavi )
pgpoolPostgreSQL
NAS ストレージ
本文 PDF
CiNii 検索サーバ 3
検索エンジン(BizSearch)
CiNii 検索サーバ 4
検索エンジン(Solr)
CiNiiインデキシング
インデキシングサーバCiNii業務サーバ
各種ログデータ
サムネイル作成ディレクトリ作成
知識インフラの BCP
•アーカイブ
• いつでもデータを使えるようにしておくこと
• 国際連携によるデータ共有・バックアップ
• オープンデータ(データの常時公開)
•コミュニティ
• CiNii の担当は 4人
• 情報をどのように伝えるか
• 例:サービス停止( 11 月 22日 17 時〜 25日 9 時)
• 状況の共有・代替案の提示
社会の中の知識インフラ
•平常時
• 「知りたい」「生み出したい」を支援する
• 研究・教育・イノベーションの基盤
•緊急時
• 間接支援の手段のひとつ
• 論文情報の一時無料化プラン
• ビジネスとの線引き
• 継続的な議論が不可欠
まとめ
•知識を守り、使い続けるための工学
• 知識インフラのレイヤー構造
• いま何ができるのか(できないのか)を知る
• 次の災害は地震か?
•社会の中の知識、社会の中の工学
• ユーザやコミュニティを巻き込む
• 情報を伝え、意義を伝える
•専門知識と「つなげる力」の必要性