Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
XMLドキュメンテーションのご紹介
2014/11/26株式会社シェアーサイト
尾関正俊
はじめに
講演の趣旨 ドキュメント作成プロセスでのXML利用への期待
『日頃使い慣れているMS Wordのスキルを活かしつつ、
XMLによるメリットを享受したい。』
XMLとは、XML利用のメリットと応用
MS Word と XMLについて
1
XML利用の現状
• 製薬業界でのXMLの利用
– eCTD– CDISC など
• ビジネス文書でのXML利用は広がっている
– 製造業(DITA 対象:技術文書や仕様書)• 情報のトピック化(細分化)、情報の再利用、情報コミュニケーションの高度化
• 技術情報の制作工程全体を視野にコンテンツ管理するXML標準技術
– 出版業(e-Pub 対象:電子出版)• 公開された標準規格による電子書籍用ファイル・フォーマット
– 金融業(XBRL 対象:企業の財務諸表)• 財務分析のための標準データ形式
XMLで扱う対象には「データ」と「文書」があるが、
製薬業界では、まだ文書作成にXMLの積極的な利用はみられない。
2
ドキュメントのライフサイクル
ドキュメントの作成~管理プロセスでのXMLの利用範囲
1• 検索
• 情報収集、ドキュメント構成
2• 執筆 (ドキュメントの参照・流用)
• レビュー (コメント付与・変更履歴・差分管理)
3• 承認
• 保管・維持 (共有・データ変換)
4• データ移行
• 廃棄
ドキュメントのライフサイクルの中でXMLの応用による効率化や全体最適化が可能。
3
ドキュメント作成で抱える課題
• 執筆者によって文書の構成にばらつきがある• 参照した文書が変更になっていることを早く知る方法がない• 文書作成のレイアウト調整に時間がかかる• 他の人のレビューコメントを、整理して反映するプロセスに時間がかかる• 確実に反映させていることを、どうやって確認するか?• 共同執筆するときの排他制御やデータの破綻が心配• ドキュメント間の整合性のチェックに、多大な人手と労力がかかっている• 差分管理ができない• 用字・用語にばらつきがある• 他の文書からのコピペで、不正なスタイルが混入する• 将来参照できる文書として管理できているのか
標準化
レイアウトスタイル
変更管理
属人的
4
XMLとは
• XML 【 Extensible Markup Language 】– 文書やデータの意味や構造を記述するためのマークアップ言語の一
つ。
– マークアップ言語とは、「タグ」と呼ばれる特定の文字列で情報の意味や構造、装飾などを埋め込んでいく言語のこと
– XMLにより統一的な記法を用いながら独自の意味や構造を持ったマークアップ言語を作成することができる。
docbook.xmlの例
タグ付けされたテキストがなぜ問題解決に大きなインパクトを与
えるのか?
XMLをどのように作成するのか?
5
XMLのメリット
– 将来参照できる文書データ(永久保存形式)
– XMLは情報の部品化がしやすい
– 用途に応じた部品(意味のある単位)の自由な組み合わせ(再利用)
– 共通のスキーマにしたがったデータを一括管理することで、検索性や次のアクションへの展開がしやすい
(検索・再利用)
‒ レイアウト処理の自動化
統一的な記法で記述されたテキストデータ
文書ファイル単位の管理から意味のある情報単位の管理
レイアウトを意識しない(執筆に専念)
ハブドキュメントとして他の形式への変換が容易6
XMLの応用
• 文書ファイル単位の管理から意味のある情報単位の管理へ
• コスト削減にむけてワープロ作業からの脱出
• より付加価値の高い業務を支援するナレッジ化
情報単位の再利用が進み、一定の品質を確保共同執筆でスピードアップ情報単位の組み合わせをテンプレート化して標準文書を作成
情報単位の再利用で、無駄な手間とコストを削減スタイル設定、スタイルQCなどの省力化でコスト削減レイアウトはシステムによる自動処理
共通スキーマで作成されたドキュメントの資産(DB)化レビュー記録もXMLで管理して過去の指摘を事前にチェック
ドキュメント作成の課題をXMLで解決するコンセプト例
7
XMLドキュメントの作成
『日頃使い慣れているMS Wordのスキルを活かしつつ、
XMLによるメリットを享受したい。』(仮説)
– Office 2007からは、XMLで記述された規格を標準ファイル形式として採用。それが Office Open XMLOOXML(Office Open XML ISO/IEC 29500)
【他の同様の規格】ODF(Open Document Format) ISO/IEC26300(2006年標準)「Open Office」
8
OOXML (Wikipediaから一部引用)
■期待されるメリット1. XMLをベースとしたオフィスイート用のファイルフォーマット
• OOXMLは、Office製品のインタフェース仕様であり、XMLの活用形態ではない。
• OOXMLはOfficeのレイアウトデータの保持・復元保証を目的としており、各業務で活用できるデータ構造のXML(スタイル構造を分離し、構造化されたXML)を出力することを目的としていない。
2. MS-Officeが無い環境でもファイルの読み書きが可能になる。• OOXML対応のオフィススイートで読み書き可能。MS-Officeが代表例。
ただし、OOXMLで保存できるオフィススイートは少ない。
→ オフィススイートの比較 – Wikipedia 参照
3. パーツに分けることによりファイル破損のリスクを限定する事ができる。
4. zip圧縮されることでファイルサイズが小さくなる。
9
オフィススイートの比較 – Wikipedia
10
OOXML
■OOXMLを見てみる
Zipに拡張子を変更
OOXのWordprocessingMLの構造は、執筆者の意識する構造とは異なり、スタイル(レイアウト)重視の構造。
(スタイル/レイアウトが再現できることがOOXMLの必須要件となっている)
11
Wordを使ったXMLドキュメンテーション
XML処理のバックエンドシステム
スタイル情報とOOXMLを利用した扱いやすいピュアなXMLに変換する
– WordからXMLに変換
(XMLの利用形態や業界標準のSchemaに変換)
– XMLからWordに変換
• 体裁に関わる情報は極力排除
• 何らかのソフトウェアで利用する事ができる文章構造へ変換
12
Wordを使ったXMLドキュメンテーション
日頃使い慣れているMS Wordをフロントエンドに用いる。
XMLを意識させない執筆環境の実現。
– ポイント
自由度を制限したWordテンプレートを用意する。
• スタイル情報とOOXMLを利用した扱いやすいピュアなXMLに変換するための仕掛け
13
XML処理のバックエンドシステム
XMLドキュメント管理ツール(その1)• 部品化されたXMLコンテンツを自動構成処理
– 複数のXMLコンテンツをまとめて、あたかも全体で1つのドキュメントのように扱う。部品毎に編集担当を分ける。
– 章立ての番号(ナンバリング)やドキュメント内の項目間リンクなどは自動的にメンテナンスする。
自動構成処理• ドキュメントの体系が決まっている
場合には、テンプレート化する。
14
XML処理のバックエンドシステム
XMLドキュメント管理ツール(その2)• ドキュメントのすべてのバージョンとドキュメントに紐付けされる情報を管
理することで、変更比較や参照管理を実現する。
• 誰が、いつ、どこを、どんな理由で変更したのかを正確にトラッキングし、比較する。
15
XML処理のバックエンドシステム
XMLドキュメント管理ツール(その3)• 個々のコンテンツ情報を自動的に部品化し、そのバージョン管理と情報
の派生管理を行う。
参照リンク情報
参照コピー情報
影響を受けるドキュメント
影響分析機能• 修正するドキュメントを参照してい
るドキュメントを検索する• ドキュメントの修正時に、以前にコ
ピーして作成したドキュメントを検索する
16
XML処理のバックエンドシステム
その他のXMLドキュメント管理ツールの機能
• 文字変数を処理する機能
• レイアウト・スタイル機能の分離
• XMLからWord/PDF変換機能Wordのテンプレートを切り替えることで多様に変換する(Wordテンプレートをスタイルシートと位置づける)
17
XMLの外部出力
XMLの外部出力
• XMLをハブドキュメントとして他の形式で利用できるように変換する。
Webページ
E-Pub
印刷組版Word
各種DB
Wordのテンプレートを切り替えることで多様に変換する(Wordテンプレートをスタイルシートと位置づける)
18
ご紹介
• OOXML– ウィキペディア
http://ja.wikipedia.org/wiki/Office_Open_XML
• Word2XML– Word⇔XML循環ソリューション
http://www.sgml-xml.jp/tools/WordtoXMLconverter.html
• crossnote(XMLドキュメンテーションシステム)
– 販売
http://www.share-site.co.jp/contents/products/crossnote.html– 開発
http://www.updateit.co.jp/
【講演内容へのお問い合わせ】
株式会社シェアーサイト 尾関正俊 [email protected]