280
PRIMECLUSTER PRIMECLUSTER™ RMS リファレンスガイド 4.3 (Oracle Solaris / Linux) 2014 5 月版

RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

PRIMECLUSTER

PRIMECLUSTER™ RMS リファレンスガイド 4.3

(Oracle Solaris / Linux)

2014 年 5 月版

Page 2: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

版権および商標

Linux は、Linus Torvalds 氏の米国およびその他の国における登録商標あるいは商標です。

Oracle と Java は、Oracle Corporation およびその子会社、関連会社の米国およびその他の国における登録商標です。

文中の社名、商品名等は各社の商標または登録商標である場合があります。

PRIMECLUSTER は、富士通株式会社の登録商標です。

その他各種製品名は、各社の製品名称、商標または登録商標です。

輸出管理規制について

本ドキュメントを輸出又は提供する場合は、外国為替及び外国貿易法及び米国輸出管理関連法規等の規制をご確認の上、必要

な手続きをおとり下さい。

お願い

●本書を無断で他に転載しないようお願いします。

●本書は予告なしに変更されることがあります。

All Rights Reserved, Copyright (C) 富士通株式会社 2008-2014

Page 3: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

目次

1 はじめに ........................................................................................................................................... 11.1 本書の構成 ....................................................................................................................................................... 11.2 マニュアル ....................................................................................................................................................... 21.3 本書の表記について ....................................................................................................................................... 2

1.3.1 表記 ....................................................................................................................................................... 21.3.1.1 プロンプト ............................................................................................................................ 21.3.1.2 マニュアルページのセクション番号 ................................................................................ 31.3.1.3 キーボード ............................................................................................................................ 31.3.1.4 書体 / 記号 ............................................................................................................................ 31.3.1.5 例 1 ......................................................................................................................................... 31.3.1.6 例 2 ......................................................................................................................................... 3

1.3.2 コマンド構文 ....................................................................................................................................... 41.4 表記記号 ........................................................................................................................................................... 41.5 略称 ................................................................................................................................................................... 41.6 変更履歴 ........................................................................................................................................................... 5

2 RMS の詳細説明 ............................................................................................................................. 72.1 内部機構 ........................................................................................................................................................... 7

2.1.1 アプリケーションと資源の記述 ....................................................................................................... 72.1.2 メッセージ ........................................................................................................................................... 8

2.2 初期化 ............................................................................................................................................................... 82.3 Online 処理 ..................................................................................................................................................... 11

2.3.1 Online 要求 ......................................................................................................................................... 112.3.1.1 手動方式 .............................................................................................................................. 122.3.1.2 自動方式 .............................................................................................................................. 12

2.3.2 PreCheckScript .................................................................................................................................... 132.3.3 userApplication の RMS グラフにおける Online 処理 ................................................................... 132.3.4 Online 処理中の予期しないレポート ............................................................................................. 152.3.5 Online 処理中の Fault ........................................................................................................................ 152.3.6 アプリケーションがすでに Online 状態にある場合の初期化処理 ............................................ 15

2.4 Offline 処理 ..................................................................................................................................................... 162.4.1 Offline 要求 ......................................................................................................................................... 162.4.2 userApplication の RMS グラフにおける Offline 処理 ................................................................... 172.4.3 Offline 処理中の予期しないレポート ............................................................................................. 182.4.4 Offline 処理中の Fault ....................................................................................................................... 182.4.5 グラフノードがすでに Offline 状態である場合 ............................................................................ 182.4.6 オブジェクトを Offline 状態にすることができない .................................................................... 18

2.5 Fault 処理 ........................................................................................................................................................ 192.5.1 Online 状態または要求処理中の Fault ............................................................................................ 192.5.2 Offline Fault ........................................................................................................................................ 212.5.3 AutoRecover 属性 ............................................................................................................................... 212.5.4 Offline 処理中の Fault ....................................................................................................................... 212.5.5 Fault 処理の例 .................................................................................................................................... 212.5.6 Fault クリア ........................................................................................................................................ 232.5.7 SysNode 異常 ...................................................................................................................................... 24

2.5.7.1 オペレータ介入 .................................................................................................................. 242.6 切替え処理 ..................................................................................................................................................... 25

2.6.1 切替え要求 ......................................................................................................................................... 252.7 アプリケーションのリソース障害処理 ..................................................................................................... 26

2.7.1 Recover オプションによる Online リカバリ .................................................................................. 262.7.2 OfflineRecover オプションによる Offline リカバリ ...................................................................... 262.7.3 追記 ..................................................................................................................................................... 27

2.8 特殊な状態 ..................................................................................................................................................... 272.8.1 保守モードの制限 ............................................................................................................................. 272.8.2 Inconsistent 状態 ................................................................................................................................. 28

2.9 RMS ハートビート ........................................................................................................................................ 292.9.1 動作の詳細 ......................................................................................................................................... 30

2.9.1.1 ELM ロックの管理 ............................................................................................................ 30

J2UZ-5294-06Z0(03)

Page 4: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

目次

2.9.1.2 初のノードの起動 .......................................................................................................... 312.9.1.3 2 番目のノードの起動 ....................................................................................................... 312.9.1.4 3 番目以降のノード ........................................................................................................... 312.9.1.5 ノードまたは RMS 停止の順序 ....................................................................................... 322.9.1.6 レスポンスの遅延 .............................................................................................................. 32

2.9.2 hvenv のデフォルトの初期化 .......................................................................................................... 332.9.3 hvenv.local での ELM の手動制御 ................................................................................................... 33

3 スケーラブルコントローラ ........................................................................................................ 353.1 コントローラの概要 ..................................................................................................................................... 353.2 スケーラブルコントローラとアプリケーション ..................................................................................... 35

3.2.1 スケーラブルアプリケーション ..................................................................................................... 353.2.2 スケーラブルコントローラによる利点 ......................................................................................... 363.2.3 スケーラブルコントローラの属性 ................................................................................................. 36

3.3 Online/Offline 処理と状態遷移 ..................................................................................................................... 373.3.1 制御されるアプリケーションの状態とコントローラの状態 ..................................................... 373.3.2 制御されるアプリケーションへの要求の伝播 ............................................................................. 383.3.3 コントローラの Warning 状態 ......................................................................................................... 383.3.4 アプリケーションの Warning 状態 ................................................................................................. 383.3.5 コントローラ StateChangeScript ...................................................................................................... 383.3.6 Online/Standby/Offline 処理の順序制御とアプリケーショングループ ...................................... 403.3.7 サブクラスタでの自動起動 ............................................................................................................. 413.3.8 サブクラスタでの切替え ................................................................................................................. 413.3.9 子アプリケーションの手動切替え ................................................................................................. 423.3.10 保守モード時の操作 ......................................................................................................................... 42

3.3.10.1 ノード間でのアプリケーションの切替え ...................................................................... 423.3.10.2 Online、Offline、および Fault 処理の制約 ..................................................................... 443.3.10.3 スケーラブルコントローラで推奨される操作 .............................................................. 45

4 トラブルシューティング ............................................................................................................ 474.1 概要 ................................................................................................................................................................. 474.2 デバッグメッセージとエラーメッセージ ................................................................................................. 484.3 ログファイル ................................................................................................................................................. 494.4 RMS BM ( ベースモニタ ) ログ出力の管理 ............................................................................................... 50

4.4.1 RMS BM ( ベースモニタ ) ログレベルの管理 ............................................................................... 504.4.2 システムログへの BM ( ベースモニタ ) 出力の制御 ................................................................... 51

4.5 アプリケーションログの出力の管理 ......................................................................................................... 524.5.1 標準スクリプトのデバッグメッセージの制御 ............................................................................. 52

4.6 ディテクタログの出力の管理 ..................................................................................................................... 524.6.1 デバッグメッセージとログレベル ................................................................................................. 534.6.2 ディテクタのログレベルの設定 ..................................................................................................... 53

4.6.2.1 hvutil -L によるディテクタのログレベルの設定 .......................................................... 534.6.2.2 PCS によるディテクタのログレベルの設定 ................................................................. 544.6.2.3 RMS Wizard Tools によるログレベルの設定 .................................................................. 55

4.7 RMS ログメッセージの意味 ........................................................................................................................ 564.7.1 switchlog メッセージの形式 ............................................................................................................. 564.7.2 アプリケーションログメッセージの形式 ..................................................................................... 574.7.3 プログラムログメッセージの形式 ................................................................................................. 58

4.8 RMS ログメッセージの表示 ........................................................................................................................ 584.8.1 switchlog およびアプリケーションログを表示する一般的な手順 ............................................. 614.8.2 時刻フィルタ ..................................................................................................................................... 624.8.3 キーワードフィルタ ......................................................................................................................... 63

4.8.3.1 リソース名 .......................................................................................................................... 634.8.3.2 重要度 .................................................................................................................................. 644.8.3.3 0 以外の終了コード ........................................................................................................... 644.8.3.4 キーワード .......................................................................................................................... 65

4.8.4 テキスト検索 ..................................................................................................................................... 664.8.5 フィルタの削除 ................................................................................................................................. 66

4.9 RMS ログファイルのクリーンアップ ........................................................................................................ 664.9.1 hvlogclean ............................................................................................................................................ 674.9.2 hvlogcontrol ......................................................................................................................................... 67

J2UZ-5294-06Z0(03)

Page 5: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

目次

4.9.3 バックグラウンドスクリプトのログ採取 ..................................................................................... 674.10 構成のトラブルシューティング ................................................................................................................. 68

4.10.1 PCS のログファイルとトレースファイル ..................................................................................... 684.10.2 手動によるスクリプトの実行 ......................................................................................................... 68

4.10.2.1 PCS GUI を使用する方法 ................................................................................................. 694.10.2.2 PCS CUI を使用する方法 .................................................................................................. 704.10.2.3 RMS Wizard Tools を使用する方法 .................................................................................. 72

4.11 RMS トラブルシューティング .................................................................................................................... 734.12 高度なトラブルシューティングのための情報収集 ................................................................................. 76

4.12.1 hvdump コマンドの使用 (RMS) ....................................................................................................... 76

5 付録 — 致命的でないエラーメッセージ ................................................................................ 775.1 ADC: Admin 構成 .......................................................................................................................................... 785.2 ADM: Admin キュー、コマンドキュー、およびディテクタキュー ..................................................... 855.3 BAS: 起動および構成定義エラー ............................................................................................................. 1015.4 BM: BM ( ベースモニタ ) ........................................................................................................................... 1075.5 CML: コマンドライン ................................................................................................................................ 1155.6 CRT: コントラクトとコントラクトジョブ .............................................................................................. 1165.7 CTL: コントローラ ..................................................................................................................................... 1175.8 CUP: userApplication コントラクト ........................................................................................................... 1185.9 DET: ディテクタ ......................................................................................................................................... 1195.10 GEN: 汎用ディテクタ ................................................................................................................................. 1225.11 INI: init スクリプト ..................................................................................................................................... 1235.12 MIS: その他 .................................................................................................................................................. 1245.13 QUE: メッセージキュー ............................................................................................................................. 1245.14 SCR: スクリプト ......................................................................................................................................... 1245.15 SWT: 切替要求 (hvswitch コマンド ) ......................................................................................................... 1255.16 SYS: SysNode オブジェクト ...................................................................................................................... 1265.17 UAP: userApplication オブジェクト .......................................................................................................... 1295.18 US: us ファイル ........................................................................................................................................... 1345.19 WLT: Wait リスト ........................................................................................................................................ 1355.20 WRP: ラッパ ................................................................................................................................................ 135

6 付録 — 致命的エラーメッセージ ........................................................................................... 1436.1 ADC: Admin 構成 ........................................................................................................................................ 1446.2 ADM: Admin、コマンド、ディテクタキュー ........................................................................................ 1446.3 BM: ベースモニタ ....................................................................................................................................... 1456.4 CML: コマンドライン ................................................................................................................................ 1476.5 CMM: 通信 ................................................................................................................................................... 1476.6 CRT: コントラクトおよびコントラクトジョブ ...................................................................................... 1476.7 DET: ディテクタ ......................................................................................................................................... 1486.8 INI: init スクリプト ..................................................................................................................................... 1496.9 MIS: その他 .................................................................................................................................................. 1516.10 QUE: メッセージキュー ............................................................................................................................. 1516.11 SCR: スクリプト ......................................................................................................................................... 1526.12 SYS: SysNode オブジェクト ...................................................................................................................... 1546.13 UAP: userApplication オブジェクト .......................................................................................................... 1546.14 US: us ファイル ........................................................................................................................................... 1556.15 WRP: ラッパ ................................................................................................................................................ 155

7 付録 — コンソールエラーメッセージ ................................................................................... 1597.1 コンソールメッセージ ............................................................................................................................... 159

8 付録 — 警告メッセージ ........................................................................................................... 1798.1 ADC: Admin 構成 ........................................................................................................................................ 1798.2 ADM:Admin キュー、コマンドキュー、およびディテクタキュー .................................................... 180

J2UZ-5294-06Z0(03)

Page 6: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

目次

8.3 BAS: 起動および構成定義エラー ............................................................................................................. 1828.4 BM:BM ( ベースモニタ ) ............................................................................................................................ 1838.5 CTL: コントローラ ..................................................................................................................................... 1868.6 CUP:userApplication コントラクト ............................................................................................................ 1878.7 DET: ディテクタ ......................................................................................................................................... 1928.8 SCR: スクリプト ......................................................................................................................................... 1938.9 SWT: 切替え要求 (hvswitch コマンド ) ..................................................................................................... 1938.10 SYS:SysNode オブジェクト ....................................................................................................................... 1998.11 UAP:userApplication オブジェクト ........................................................................................................... 2008.12 US:us ファイル ............................................................................................................................................ 2018.13 WLT:Wait リスト ......................................................................................................................................... 2038.14 WRP: ラッパ ................................................................................................................................................ 204

9 付録 — 通知メッセージ ........................................................................................................... 2059.1 ADC: Admin 構成 ........................................................................................................................................ 2059.2 BM:BM ( ベースモニタ ) ............................................................................................................................ 2059.3 SWT: 切替え要求 (hvswitch コマンド ) ..................................................................................................... 2069.4 SYS:SysNode オブジェクト ....................................................................................................................... 2069.5 US:us ファイル ............................................................................................................................................ 2079.6 WRP: ラッパ ................................................................................................................................................ 208

10 付録 — オペレーティングシステムエラー番号 ................................................................... 209

11 付録 — 状態 ................................................................................................................................. 21111.1 基本状態 ....................................................................................................................................................... 21111.2 状態の詳細 ................................................................................................................................................... 212

12 付録 — オブジェクトタイプ ................................................................................................... 213

13 付録 — 属性 ................................................................................................................................ 21513.1 ユーザ設定属性 ........................................................................................................................................... 21513.2 RMS 構成ウィザード管理属性 .................................................................................................................. 220

14 付録 — 環境変数 ........................................................................................................................ 22314.1 RMS 環境変数の設定 .................................................................................................................................. 22314.2 RMS グローバル環境変数 .......................................................................................................................... 22414.3 RMS ローカル環境変数 .............................................................................................................................. 22814.4 RMS スクリプト実行環境変数 .................................................................................................................. 230

15 付録 — RMS コマンドラインインタフェース ...................................................................... 23315.1 使用可能な RMS CLI コマンド ................................................................................................................. 233

16 付録 — マニュアルページ ....................................................................................................... 23516.1 CCBR ............................................................................................................................................................ 23516.2 CF .................................................................................................................................................................. 23516.3 CIP ................................................................................................................................................................. 23616.4 PAS ................................................................................................................................................................ 23616.5 クラスタリソース管理機構 ....................................................................................................................... 23616.6 RMS ............................................................................................................................................................... 23716.7 シャットダウン機構 (SF) ........................................................................................................................... 23816.8 非同期監視 (MA) ......................................................................................................................................... 23916.9 Web-Based Admin View ............................................................................................................................... 23916.10 RMS ウィザード .......................................................................................................................................... 24016.11その他のユーティリティ ........................................................................................................................... 240

17 付録 — リリース情報 ............................................................................................................... 241

用語集 ................................................................................................................................................ 243

J2UZ-5294-06Z0(03)

Page 7: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

目次

略語 .................................................................................................................................................... 259

図 ........................................................................................................................................................ 263

表 ........................................................................................................................................................ 265

索引 .................................................................................................................................................... 267

J2UZ-5294-06Z0(03)

Page 8: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

目次

J2UZ-5294-06Z0(03)

Page 9: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

1 はじめに

本書では、RMS ウィザードを使用して RMS を構成したり、Cluster Admin GUI で RMS を管理するための、Reliant® Monitor Services (RMS) の機能について説明します。RMS は、クラスタのノード上で動作するアプリケーションに対して、システムレベルの高可用性を保証するソフトウェアモニタです。

本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。

読者は、PCS、RMS Wizard Tools、Cluster Admin GUI、RMS の CLI コマンドおよびユーティリティ、ならびに以下のシステム機能およびコンポーネントについてよく理解していることが必要です。

● PRIMECLUSTER 製品ファミリ

● Oracle Solaris または Linux オペレーティングシステム

● そのシステムにインストールされた PRIMECLUSTER 以外の製品

1.1 本書の構成

本書は以下の章で構成されています。

● 7 ページの "2 RMS の詳細説明 " RMS における状態検出と状態遷移の処理について説明します。

● 35 ページの "3 スケーラブルコントローラ " では、スケーラブルコントローラおよびスケーラブルアプリケーションの操作について詳細に説明します。

● 47 ページの "4 トラブルシューティング " では、RMS のトラブルシューティングについて説明し、そのエラーメッセージ、エラーの原因、および解決方法を示します。

● 77 ページの "5 付録 — 致命的でないエラーメッセージ (Non-fatal error messages)" では、ログファイルに出力されるすべての RMS エラーメッセージの一覧をそれぞれの原因および対策を示します。

● 143 ページの "6 付録 — 致命的エラーメッセージ (Fatal error messages)" では、ログファイルに出力されるすべての致命的 RMS エラーメッセージとそれぞれの原因および対策を示します。

● 159 ページの "7 付録 — コンソールエラーメッセージ " では、コンソールに出力されるすべてのRMS エラーメッセージとそれぞれの原因および対策を示します。

● 179ページの "8 付録 — 警告メッセージ " では、ログファイルに出力されるすべてのRMS警告メッセージとそれぞれの原因および対策を示します。

● 205ページの "9 付録 — 通知メッセージ " では、ログファイルに出力されるすべてのRMS通知メッセージとそれぞれの原因および対策を示します。

● 209 ページの "10 付録 — オペレーティングシステムエラー番号 " では、Oracle Solaris および Linuxのオペレーティングシステムエラー番号について記載しています。

● 211 ページの "11 付録 — 状態 " では、RMS で提供されるオブジェクトの状態を示します。

● 213 ページの "12 付録 — オブジェクトタイプ " では、RMS で提供されるすべてのオブジェクトタイプを示します。

● 215 ページの "13 付録 — 属性 " では、各オブジェクトタイプに対して指定する必要がある属性を示します。

● 223 ページの "14 付録 — 環境変数 " では、RMS 環境変数について説明します。

● 233 ページの "15 付録 — RMS コマンドラインインタフェース " では、RMS 管理 CLI コマンドを示します。

● 235 ページの "16 付録 — マニュアルページ " では、PRIMECLUSTER のマニュアルページ一覧を示します。

● 241 ページの "17 付録 — リリース情報 " では、本マニュアルの主な変更内容を示します。

J2UZ-5294-06Z0(03) 1

Page 10: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

マニュアル はじめに

1.2 マニュアル

このセクションで紹介するマニュアルには、PRIMECLUSTER に関する情報が記載されています。

PRIMECLUSTER には本書以外に以下のマニュアルがあります。

● "PRIMECLUSTER Cluster Foundation 導入運用手引書 " — PRIMECLUSTER CF の構成設定および管理方法について説明しています。

● "PRIMECLUSTERコンセプトガイド " — PRIMECLUSTER製品ファミリの概念について説明しています。

● "PRIMECLUSTER Global Disk Services 説明書 " — GDS の構成設定および管理について説明しています。

● "PRIMECLUSTER Global File Services 説明書 " — GFS の構成設定および管理について説明しています。

● "PRIMECLUSTER Global Link Services 説明書 ( 伝送路二重化機能編 )" — GLS 伝送路二重化機能の構成設定および管理について説明しています。

● "PRIMECLUSTER Global Link Services 説明書 ( マルチパス機能編 )" — GLS マルチパス機能の構成設定および管理について説明しています。

● "PRIMECLUSTER Web-Based Admin View 操作手引書 " — 各 PRIMECLUSTER サービスの運営管理GUI を使用するための共通基盤として動作する Web-Based Admin View について説明しています。

● "PRIMECLUSTER 導入運用手引書 " — PRIMECLUSTER システムの導入から運用管理までの一連の流れ、および操作について説明しています。

● "PRIMECLUSTER RMS 導入運用手引書 " — PRIMECLUSTER RMS ウィザードを使用して、RMSを構成および管理する手順について説明します。

● " ソフトウェア説明書 / インストールガイド " — このドキュメントには、PRIMECLUSTER のインストール、構成設定、および操作に関する 新情報が記載されています。

以降、マニュアル名の "PRIMECLUSTER" を省略して記述する場合があります。

1.3 本書の表記について

表現を標準化するため、このマニュアルにはいくつかの表記上、印刷上、構文上の規則があります。

1.3.1 表記

以下の表記規則があります。

1.3.1.1 プロンプト

実行にシステム管理者 ( ルート ) 権限が必要なコマンドライン例の場合、先頭にシステム管理者プロンプトを示すハッシュ記号 (#) が付いています。いくつかの例で、<nodename># という表記は、指定されたノードの rootプロンプトを表しています。 たとえば、コマンド名の前に fuji2#が記述されていると、そのコマンドが fuji2という名前のノード上で、rootユーザとして実行されたことを示しています。システム管理者権限を必要としないエントリの場合、先頭にドル記号 ($) が付いています。

2 J2UZ-5294-06Z0(03)

Page 11: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

はじめに 本書の表記について

1.3.1.2 マニュアルページのセクション番号

オペレーティングシステムコマンドの後ろにマニュアルページのセクション番号が括弧付きで示されています。例 : cp(1)

1.3.1.3 キーボード

印字されない文字のキーストロークは< Enter >や< F1 >などのキーアイコンで表示されます。たとえば、< Enter >は Enter というラベルの付いたキーを押すことを意味し、< Ctrl > + < B >は Ctrlまたは Control というラベルの付いたキーを押しながら< B >キーを押すことを意味します。

1.3.1.4 書体 / 記号

以下の書体は特定要素の強調に使用されます。

書体規則の例を以下に示します。

1.3.1.5 例 1

以下に /etc/passwdファイルのエントリの一部を示します。

root:x:0:1:0000-Admin(0000):/:sysadm:x:0:0:System Admin.:/usr/admin:/usr/sbin/sysadmsetup:x:0:0:System Setup:/usr/admin:/usr/sbin/setupdaemon:x:1:1:0000-Admin(0000):/:

1.3.1.6 例 2

cat(1) コマンドでファイルの内容を表示するには、以下のコマンドラインを入力します。

$ cat <ファイル名>

書体 使用方法

固定幅 コンピュータ出力、およびプログラムリスト : テキスト本文中のコマンド、ファイル名、マニュアルページ名、他のリテラルプログラミング項目

斜体 具体的な数値に置き換える必要のある変数。具体的な数値に置き換える必要のあるコマンド行の変数。隣接する文字列と区別するためかぎ括弧で括られて表記される場合がありますが ( 例 : <nodename>RMS)、特に指定のない限り、かぎ括弧は入力対象ではありません。

CUI または GUI 内の項目名。例としては、メニュー項目、ラジオボタン、チェックボックス、文字列入力ボックス、パネル、ウィンドウタイトルなどがあります。

太字 記述どおりに入力する必要のあるコマンドライン項目

" 均等幅 " 参照先のタイトル名、マニュアル名、画面名等

[ 均等幅 ] ツールバー名、メニュー名、コマンド名、アイコン名

<均等幅> ボタン名

J2UZ-5294-06Z0(03) 3

Page 12: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

表記記号 はじめに

1.3.2 コマンド構文

コマンド構文には以下の規則があります。

1.4 表記記号

重要な情報があることを示します。

データが破損する可能性がある状態を示します。

特に注意が必要な事項を示します。

1.5 略称

Oracle Solaris は、Solaris、Solaris Operating System、または Solaris OS と記載することがあります。

参照する Oracle Solaris ( 以降、Solaris) のマニュアル名称で "Solaris X" と書かれている部分は、OracleSolaris 10 ( 以降、Solaris 10 ) 、または Oracle Solaris 11 ( 以降、Solaris 11) と読み替えてマニュアルを参照してください。

記号 名前 意味

[ ] 角括弧 オプション項目を囲む。

{ } 波括弧 択一選択の複数選択肢を囲む。各項目は縦線 (|) で区切られる。

| 縦線波 括弧で囲まれている場合は、択一選択の各選択肢の区切り。波括弧で囲まれていない場合は、1 つのプログラムの出力が他のプログラムの入力にパイプされることを示すリテラル要素。

( ) 丸括弧 繰り返しの際にグループ化される項目を囲む。

... 省略符号 項目の繰り返しを示す。1 グループの項目を繰り返す場合には、項目グループを丸括弧で囲む。

4 J2UZ-5294-06Z0(03)

Page 13: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

はじめに 変更履歴

1.6 変更履歴

追加・変更内容 変更箇所 マニュアルコード

(BM, 29) の対処法を修正しました。 5.4 J2UZ-5294-06Z0(01)

属性「OnlineTimeout」を削除しました。 13.1

マスタープロセスの記事を削除しました。 5.126.9

以下のメッセージを削除しました。- (ADM, 117)- (ADC, 64)- (ADM, 36)- (SWT, 81) - (US, 38)- (US, 39)- (US, 54)

8.29.19.29.39.5

親アプリケーションと子アプリケーションが同時に切替わった場合の子アプリケーションの状態遷移について追記しました。

3.3.2 J2UZ-5294-06Z0(02)

以下のコマンドの説明を削除しました。- hvdist- hvgdmake- hvrclev- hvreset- hvthrottle

2.23.3.515.116.6

J2UZ-5294-06Z0(03)

HV_OFFLINE_REASON の説明を変更しました。 14.4

J2UZ-5294-06Z0(03) 5

Page 14: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

変更履歴 はじめに

6 J2UZ-5294-06Z0(03)

Page 15: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

2 RMS の詳細説明

本章では、RMS 状態遷移機構について説明します。特に、各状態の判別はどのようにして行われるのか、RMS はどのようにして状態変化を起こし、またどのようにして状態の変化に対応するのかについて説明します。本章で説明する内容は以下のとおりです。

● 7 ページの "2.1 内部機構 " では、オブジェクト指向の考え方に基づいて RMS BM ( ベースモニタ )について説明しています。

● 8 ページの "2.2 初期化 " では、グラフノードの制御を RMS へ転送する処理について説明します。

● 11 ページの "2.3 Online 処理 " では、グラフノードの Online状態への遷移について説明します。

● 16 ページの "2.4 Offline 処理 " では、グラフノードの Offline状態への遷移について説明します。

● 19 ページの "2.5 Fault 処理 " では、RMS がどのように Fault状態を処理するかを説明します。

● 25 ページの "2.6 切替え処理 " では、クラスタアプリケーションを他のクラスタノードに切替える方法について説明します。

● 26 ページの "2.7 アプリケーションのリソース障害処理 " では、リソースに障害が起きたときの処理について説明します。

● 27 ページの "2.8 特殊な状態 " では、保守モード時、不整合時などの処理について説明します。

● 29 ページの "2.9 RMS ハートビート " では、ハートビートを利用した監視と処理について説明します。

本章では、グラフ理論でいうノード ( 節点・頂点 ) のことをクラスタノードと区別するために、グラフノードと呼んでいます。

2.1 内部機構

RMS をより理解しやすくするため、オブジェクト指向の考え方に基づき、RMS BM ( ベースモニタ ) の内部機構を簡単に説明します。

個々のオブジェクトは、自らの状態およびディテクタ等の他のオブジェクトから受信したメッセージに基づき、定められた規則に従って動作する ( 通常はシェルスクリプトで実装されています ) 独立したインスタンスです。状態、ディテクタ、スクリプトについては "RMS 導入運用手引書 " の概要の章で説明しています。以下のセクションでは、RMS の内部構造とオブジェクト間通信について詳しく説明します。

2.1.1 アプリケーションと資源の記述

RMS ウィザード は、RMS の監視対象であるすべてのアプリケーションの記述を生成します。この記述では、RMS 固有のメタ言語を使用し、以下の特徴を持つ論理グラフによってすべてのアプリケーションを表現します。

● アプリケーションが必要とする資源は、このグラフ中のオブジェクトで表す。

● オブジェクト間の親子関係は、それを表す資源間の依存関係を表す。

● オブジェクトの属性とは、各種資源の特性と、その資源にとって必要とされる動作を表す。

特定のオブジェクトを Onlineにしたり、Offlineにしたりする場合の事前の手順は、オブジェクトの属性として設定されたシェルスクリプトに記述されます。また、他のオブジェクトからのメッセージを受けて、オブジェクトの状態遷移に対応して実行されるべき処理を記述するスクリプトもあります。

userApplication オブジェクトにはディテクタがありません。また、RMS Wizard Tools または、RMSWizard Kit によって作成される場合には、スクリプトも指定されません。しかし、子である cmdline リソースには適切なスクリプトが与えられます。オペレーティングシステム環境において、実際のユーザ業務と通信を行うのはこのオブジェクトです。この場合、userApplication は RMS グラフにおける資源の複合状態を表す論理的なシンボルになります。

J2UZ-5294-06Z0(03) 7

Page 16: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

初期化 RMS の詳細説明

2.1.2 メッセージ

RMS オブジェクトは以下の目的でメッセージ通信を行います。

● 他のオブジェクトへ要求を送信する。

● オブジェクトの状態変化を通知する。

通常、オブジェクトは直接の親と子のみ通信を行います。

RMS は受信した外部要求を、まず親 userApplication オブジェクトへ送信し、それから子に転送します。userApplicationオブジェクトは、状態の変化 (Faulted状態への状態の遷移など ) に基づいて固有の要求を生成することもできます。userApplicationオブジェクトから発生する要求は、親から子へ転送されます ( トップダウン )。

2.2 初期化

RMS が起動すると、すべてのグラフノードの初期状態は Unknownとなります。RMS は、個々のグラフノードが自らの状態を判断するために必要な情報を獲得してから、この状態を変更します。

グラフノードが自らの状態を判断するために必要な情報とは、以下のとおりです。

● ディテクタを保持するグラフノードの場合 — ディテクタからの 初の通知

● 子を持つグラフノード — 子の状態に関するメッセージ

上記より、以下の 2 つの結論が導き出されます。

● ディテクタの存在しないリーフノードは、ディテクタからの通知を受けることがなく、かつ、グラフノードの状態を子の状態からも類推することができないことになります。この場合、Unknownの状態が残ってしまうため、RMS 構成としては認められない構成となります。

● Unknown からの状態遷移は、リーフノードから userApplication オブジェクトへと続くボトムアップ形式で行われます。リーフノードの上位グラフノードはすべて、自己の状態を識別するためには、まず、子の状態を取得する必要があります。

SysNode オブジェクトおよび userApplication オブジェクトには、対応するハードウェアのディテクタがありません。 SysNodeオブジェクトはベースモニタから直接ディテクタのレポートを受信します。 userApplicationオブジェクトの状態は、その子の状態から判断します。

userApplicationオブジェクトの状態が Unknownから変更された段階で、userApplicationの初期化処理が完了し、RMS の制御が開始されます。

userApplicationオブジェクトの初期化プロセスは、互いの userApplicationに対して無関係で行われます。したがって、ある userApplicationオブジェクトが Online、Offlineまたは Standbyの状態に変化しても、他の userApplicationオブジェクトは Unknownの状態のままである場合があります。

SysNode オブジェクトの初期化プロセスもまた、他とは無関係に行われます。SysNode オブジェクトは、ディテクタの通知を受信した後に初期の Unknown状態から他の状態へ遷移します。

Unknown 状態は初期状態のときのみ存在し、一度 Unknown 状態から他の状態へ変化したグラフノードが、Unkwnon状態に戻ることはありません。

構成例

以下にfuji2RMSおよびfuji3RMS上で実行するよう構成設定されたアプリケーションappを例にとって RMS の処理を説明します。

8 J2UZ-5294-06Z0(03)

Page 17: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

RMS の詳細説明 初期化

● fuji2RMS および fuji3RMS の各ノードには、そのノードと同じ名前の SysNode オブジェクトが1つ存在します。

● アプリケーションが実行される各 SysNodeでは、対応する userApplicationオブジェクトがタイプ andOpの子を持ち、これらの子にはこの SysNodeの名前が HostName属性として与えられています。このアプリケーションでのノードの優先順位は、userApplicationオブジェクトでノードを定義した順序によって決定します。

ベースモニタはこのレベルの andOpオブジェクトについて、HostName属性の値がローカルノード名に対応すればローカルオブジェクトであると判断し、対応しなければリモートオブジェクトと判断します。 ベースモニタは、すべてのリモートオブジェクトを無視します。このため、ローカルオブジェクトとその子だけが処理されます。

● この論理 AND オブジェクトの子として、他の資源 (Cmdlineサブアプリケーションやローカルファイルシステム ) がそれぞれの内部的な依存関係に基づいて構成されます。

オブジェクト階層を図 1 に示します。

図 1: 初期化の例におけるオブジェクト階層

図の階層には、アプリケーションの親として、SysNodeオブジェクトが含まれています。慣例で記載されることがありますが、SysNodeオブジェクトはいかなる形でもアプリケーションオブジェクトに依存していません。しかし、SysNode オブジェクトを記載することにより、アプリケーションの子であるandOp オブジェクトがどのノードを表しているのかが明確になります。SysNode オブジェクトは GUIが生成するグラフにも表示されますが、その場合は、アプリケーションが現在実行されているノードを示すことが主目的です。

RMS Wizard Tools によって作成されたこの構成の RMS グラフを図 2 に示します。fuji2RMSと appとを結ぶ線が緑色で表示され、アプリケーションが Onlineであることを示しています。

lfs

SysNode

userApplication

andOp

gResource

gResource

fuji2RMS fuji3RMS

app

andOp1 andOp2

cmd

J2UZ-5294-06Z0(03) 9

Page 18: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

初期化 RMS の詳細説明

図 2: 初期化におけるシステムグラフの例 — RMS Wizard Tools の構成

タイトルバーにはグラフが描かれたノードの名前 fuji2RMSが表示されます。 fuji2RMSと appを結ぶ線は緑です。これはノードに Onlineのアプリケーションがあることを示しています。

図 3 は、「hvdisp -a」による出力を示しています。

図 3: 初期化における hvdisp 出力の例 — RMS Wizard Tools の構成

hvdisp の出力に対応させるため、実際のグラフにはリソース名のデータも含まれています。リソース名は、Cluster Admin の [rms&pcs] タブ表示のグラフで [Preferences] メニューから [Show Resource Names]を選択することにより表示されます。

PCS によって実際に生成されるオブジェクト名には、図 1 のオブジェクト名よりも複雑な名称が使われていることがあります。図 1 は、一般的なオブジェクト名を使用した抽象化されたグラフです。 さらに実際のグラフには、正しい動作を保証するために、依存関係が自動的に挿入されています。 Cluster Adminの [Preferences] メニューから別の項目を選択すると、さらに詳細な項目や追加のオブジェクトおよび依存関係が表示されます。

同じ例を RMS Wizard Tools で構成設定した場合、リソース名は少し違った形式で生成されます。 この場合でもグラフの構造は同一です。

10 J2UZ-5294-06Z0(03)

Page 19: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

RMS の詳細説明 Online 処理

実際のグラフに出現する追加項目や複雑な名称についての知識は、RMS の動作の基本を理解する上では必要ありません。 説明を簡単にするため、この章の例では主に抽象化されたグラフと一般的な名称を使います。

例 1

図 1 に示された構成では、以下のような処理が順に行われます。これは fuji2RMSで動作するモニタの場合でも同じです。

1. RMS が起動します。

2. SysNodeオブジェクトのディテクタはクラスタノードの状態をベースモニタに通知します。

3. cmdおよび lfsリソースのディテクタは、それぞれの状態を Offlineと報告します。

4. lfsはリーフノードであるため、即座に Offline化して、その状態変化を親に通知します。

5. ディテクタの通知と子の通知を受信すると、cmd には、それぞれの状態を決定するために必要な情報が揃ったことになります。cmdは Offline化し、その状態変化を親 andOp1に通知します。

andOp2は、fuji2RMSのベースモニタにより無視されるリモートノードです。

6. andOp1 は、ディテクタを持たない論理オブジェクトです。このオブジェクトは子のメッセージを利用して自らの Offline状態を検出し、その状態変化を appに通知します。

7. appも、ディテクタを持たないオブジェクトです。ローカルノードに対応する子andOpがOffline化すると、appも Offline化します。

8. appのローカル子オブジェクトすべてが、Unknown状態に遷移すると、初期化プロセスは完了します。

2.3 Online 処理

userApplication オブジェクトを Online 処理すると、通常 userApplication が Online 状態に遷移します。1つの userApplicationオブジェクトの Online処理は、他の userApplicationオブジェクトの Online処理とは無関係で独立に行われます。

以下のような状況が発生すると、userApplicationの Online処理が正しく終了しない場合があります。

● PreCheckScriptで userApplicationを Onlineにすべきではないと判断された。

● Online処理中に異常 (Fault) が発生した。

これらの場合について、以下のセクションで説明していきます。

2.3.1 Online 要求

Online要求を生成することを userApplicationの切替えと呼びます。これは、userApplicationを Onlineに切替えること、または userApplicationを他のクラスタノードに切替えることを意味しています (25 ページの "2.6 切替え処理 " も参照してください )。

以下の操作で Online要求を生成することができます。

● GUI または CLI (hvswitch) を使った手動要求

● GUI または CLI (hvcm) を使った RMS 起動時の自動要求

● アプリケーションの AutoSwitchOver属性によって制御される自動要求 :

– AutoSwitchOverに、ResourceFailureを設定しており、障害 (Fault) が発生した場合

– AutoSwitchOverに、ShutDownを設定しており、ノードが停止した場合

– AutoSwitchOverに、HostFailureを設定しており、ノードが強制停止した場合

J2UZ-5294-06Z0(03) 11

Page 20: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

Online 処理 RMS の詳細説明

2.3.1.1 手動方式

手動方式を使用する場合でも、userApplicationには、以下の 2 つの切替方式があります。切替方式は以下のとおりです。

● 優先切替え — RMS が userApplicationをどの SysNode上で Onlineにするかを選択します。userApplicationは RMS によって も優先順位の高い SysNodeへ切替えられます。userApplicationオブジェクトの PriorityList属性の順序によって、SysNodeオブジェクトの優先順位は決定します。

● 指定切替え — ユーザが userApplication をどの SysNode 上で Online にするかを選択します。userApplicationは指定された SysNodeへ切替えられます。

優先切替えの場合も、指定切替えの場合も、切替え先として指定できる SysNodeオブジェクトは、その状態が Onlineでなければなりません。

GUI を使った手動要求

GUI を使って Online要求を生成するには、以下の手順で行います。

1. RMS グラフ上で、userApplicationを右クリックします。ポップアップメニューが表示されます。

2. ポップアップメニューの [ 切替え ] または [Online] を左クリックします。

CLI を使用した手動要求

各 userApplicationへの Online要求は、hvswitchを使用します。hvswitchコマンドの使用方法とオプションについては、hvswitchのマニュアルページを参照してください。

2.3.1.2 自動方式

自動方式では、userApplicationは優先切替えのみで動作します。

RMS 起動時の自動要求

クラスタシステムで RMS を 初に起動した時に、以下の条件すべてが満たされていると、RMS は も優先順位の高いクラスタノード上で userApplicationを Onlineに切替えます。

● userApplicationに関連付けられた全 SysNodeオブジェクトが Onlineになっている。

● 他のクラスタノードで userApplication が Online および不整合 (Inconsistent) になっていない。

● userApplicationの AutoStartUp属性が設定されている。

● userApplicationのグラフに Faulted状態のオブジェクトがない。

これは、同時に複数のクラスタノードで userApplicationが Onlineに遷移しないために必要な条件です。

userApplicationが起動後すでに Online状態にあれば、AutoStartUpが設定されていない場合やすべての SysNode が Online 状態にない場合でも、userApplication に対する自動起動要求が直ちに生成されます。これは、Onlineの userApplicationのグラフを整合状態にすることを目的としています。そうでないと、Online状態のアプリケーションのグラフに Offlineのオブジェクトが存在する恐れがあります。

12 J2UZ-5294-06Z0(03)

Page 21: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

RMS の詳細説明 Online 処理

障害 (Fault) 発生時の自動切替え

userApplicationで異常 (Fault) を検出した場合、または userApplicationが動作中の SysNodeの異常 (Fault) を検出した場合、RMS は優先切替えを起動します。自動切替えは、userApplicationの AutoSwitchOver属性によって、以下のとおり制御されます。

● AutoSwitchOverに、ResourceFailureを設定しており、障害 (Fault) が発生した場合

● AutoSwitchOverに、ShutDownを設定しており、ノードが停止した場合

● AutoSwitchOverに、HostFailureを設定しており、ノードが強制停止した場合

AutoSwitchOverが Noに設定されていると、自動切替えは行われません。

2.3.2 PreCheckScript

Online処理を開始する前に、PreCheckScriptで、Online処理が必要かどうか、または可能かどうかが確認されます。この処理が必要な理由は、一部のアプリケーションが Online 処理で起動できず、Faulted状態になることを避けるためです。

PreCheckScript は、Online 処理が開始する前に起動され、Online 処理が必要かどうかを判断します。その判断基準は PreCheckScriptが 0で終了 ( 正常終了 ) することです。PreCheckScriptが 0以外の終了コードで終了した場合は、Online処理は破棄され、警告メッセージが switchlog に記載されます。

PreCheckScript の終了結果

PreCheckScriptが起動すると、userApplicationの状態は Wait状態に遷移します。PreCheckScriptが失敗すると、userApplicationグラフノードは以前の状態 ( 通常は Offlineまたは Faulted) に戻ります。

AutoSwitchOver

PreCheckScriptが失敗し、AutoSwitchOver属性に ResourceFailureが設定されている場合は、指定切替え要求の場合を除き、Online 要求は自動的に次に優先順位の高いクラスタノードに転送されます。

2.3.3 userApplication の RMS グラフにおける Online 処理

RMS グラフに関する PreOnline要求処理は以下のとおりです。

1. 要求が親グラフノードから、子のグラフノードへ送信される。

2. 親のグラフノードは Wait状態になる。ただし、スクリプトは起動されない。

3. 子グラフノードが要求を受け、リーフノードで PreOnlineScriptが起動される。

4. スクリプトが終了すると、親グラフノードへ確認を送信する。

5. すべての子が確認を送信し終ると、その親のグラフノードで PreOnlineScriptが実行される。

上記の手順は、RMS グラフに関連して、Online 処理におけるスクリプトがボトムアップ方式で実行されることを示しています。

userApplication グラフノードは、PreOnlineScript を実行する 後のグラフノードであり、PreOnlineScript の実行後に Online 要求を生成し、その要求をリーフノードへ送ります。ただし、Online処理と PreOnline処理は異なる処理です。

RMS グラフに関する Online処理は以下のとおりです。

1. RMS が OnlineScriptを実行する。

2. 個々のグラフノードのディテクタが Online 状態を通知するまでシステムは待ち続ける。グラフノードにディテクタが存在しない場合は、OnlineScript終了後、Online状態の送信を待たずに PostOnlineScriptを実行する。

J2UZ-5294-06Z0(03) 13

Page 22: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

Online 処理 RMS の詳細説明

3. PostOnlineScriptが実行される。

4. Online処理の成功が親グラフノードへ転送される。

5. 親グラフノードが Wait状態から Online状態へ遷移する。

RMS では、「userApplicationが Online状態である」ということは、userApplicationを構成するすべてのグラフノードが Online状態であることになります。ここでいう Online状態とは、実際のアプリケーションの状態を示すものではありません。実際のアプリケーションは RMS で制御されてはいないか、userApplicationオブジェクト ( より一般的には cmdlineの子オブジェクト ) 用に構成設定された OnlineScript (PostOnlineScript の場合もある ) で起動されているかのいずれかになります。userApplicationオブジェクトが Online状態であるということは、スクリプトの実行が正常に終了したことを示しているだけです。

スクリプトが実際のアプリケーションの状態にどのような影響を及ぼすのかは、アプリケーション自身によって決まります。RMS はユーザ業務に対し直接の制御は何ら行いません。詳細については、"RMS 導入運用手引書 " の "RMS 構成と実システム " を参照してください。

例 2

この例での処理の流れは次のとおりです。

● AutoStartUp属性が 1 に設定されている。

● PreOnlineScript定義を持つリソースオブジェクトがない。

● 起動時に、すべてのオブジェクトが Offline状態である。

Online処理は次のとおりです。

1. RMS が起動します。

2. AutoStartUp属性が 1 に設定されているため、fuji2RMS上の userApplicationオブジェクト appが PreOnline要求を生成します。

3. この要求は、lfsリーフノードに転送されます。この例では PreOnlineScriptが構成設定されたオブジェクトが存在しないため、lfs は、app に対して PreOnline 処理が正常終了したことを示すメッセージを送信します。

4. app は PreOnline 完了のメッセージを受信すると、Online 要求を生成し、lfs リーフノードに送信します。

5. lfsオブジェクトが OnlineScriptを実行し、ディスクを Online化します。

6. lfsのディテクタが Onlineの通知を行うと、Online処理の成功が直ちに cmdオブジェクトに向かって上方に通知されます ( オブジェクトに PostOnlineScriptが存在した場合は、成功メッセージが転送される前に実行されています )。

7. cmdオブジェクトが自らの OnlineScriptを起動します。

8. cmdのディテクタが成功の通知を行うと、そのメッセージは直ちに andOp1に転送されます。

9. andOp1 オブジェクトはディテクタを持たないオブジェクトで、この例では OnlineScript も持っていません。ローカルの子から Online 状態の通知があると、直ちに自らの親オブジェクトに対して app成功のメッセージを転送します。

10. app で成功メッセージを受信すると、RMS が OnlineScript を実行し、アプリケーションが起動します。app にディテクタが存在せず、PostOnlineScript が設定されていないため、appは OnlineScriptの完了直後に Online状態に変化します。

14 J2UZ-5294-06Z0(03)

Page 23: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

RMS の詳細説明 Online 処理

2.3.4 Online 処理中の予期しないレポート

Online 処理中の予期しないレポート(Unexpected report)とは、Online 処理中に通知されるが、BM(ベースモニタ)により無視される Online状態以外のレポートのことです。

BM(ベースモニタ)により無視される Online状態以外のレポートは、あるオブジェクトが属するユーザアプリケーションの Online処理が開始してから、そのオブジェクトの Online処理が成功または失敗するまでの間に通知されることがあります。

なお、オブジェクトの Online 処理が失敗するケースについては、15 ページの "2.3.5 Online 処理中のFault" を参照してください。

2.3.5 Online 処理中の Fault

Online処理中にエラーが発生すると、影響するグラフノードは Fault処理を開始し、親グラフノードにエラーを通知します (19 ページの "2.5 Fault 処理 " も参照してください)。Online処理中に異常が発生するのは、以下のような場合です。

a. Online処理終了時点で、あるリソースオブジェクトのディテクタから 後に報告された状態がOfflineまたは Faulted状態である場合。

b. スクリプトが 0以外の値で終了した。

c. スクリプトが復帰せずタイムアウトになり実行に失敗した。

d. オブジェクトの OnlineScriptが完了し、ディテクタから一定時間内に Online状態が通知されなかった。

条件 a の場合は、オブジェクトが属する userApplicationの Online処理が 完了した後に Fault処理が開始されます。

反対に、条件 b、c および d の場合は、条件が満たされるとすぐに Fault処理が開始されます。

2.3.6 アプリケーションがすでに Online 状態にある場合の初期化処理

RMS の初期化時に userApplicationの RMS グラフ全体が Onlineになっている場合があります。この場合、PreCheckScriptは実行されず、関連するグラフノードは Unknown状態からスクリプトを起動せずに直接 Online状態に遷移します。

Online 時の要求

userApplicationがすでに Online状態である場合に Online要求を受信すると、その要求は他のグラフノードに通常どおりに転送されます。11 ページの "2.3 Online 処理 " での説明との相違点は、すでにOnline状態のグラフノードが要求や応答を転送する場合、スクリプトの実行も Wait状態への遷移も行われないということです。特に PreCheckScriptは実行されません。

RMSの初期化時に常にOnline状態になっているオブジェクトの典型例は、物理ディスクのgResourceオブジェクトです。物理ディスクは通常、ソフトウェアインタフェースでは停止できないからです。

Online 時の要求が存在しない場合

userApplicationがすでに Online状態にあり、RMS が初期化済の場合に、Online要求が受信されないと、userApplicationはあたかも明示的な Online要求を受信したかのように、自らのグラフのOnline処理を実行します。この結果、ローカルグラフの状態は前の例とまったく同じになります。

J2UZ-5294-06Z0(03) 15

Page 24: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

Offline 処理 RMS の詳細説明

アプリケーションがすでに Online 状態にある場合にデータの喪失を防止する

RMS の主な目的は、同じアプリケーションがクラスタ内の複数のノードに対して同時に処理を行った場合のデータ喪失を防止することにあります。このため上記のいずれの例でも、アプリケーションのグラフの Online 処理が終わると、ローカルノードのベースモニタは userApplication オブジェクトがOnline 状態にあることを他のノードのベースモニタに通知し、対応するアプリケーションがクラスタ内の他の場所で Online化するのを防止します。

RMS の初期化直後に複数のクラスタノードで HA 型である userApplicationが Onlineになっていると、重大な問題が発生する可能性があります。この場合、RMS は FATAL ERRORメッセージを生成して、以後の userApplicationに対する要求を抑止します。これにより、クラスタの不整合によって発生する障害の可能性を 小限に抑えます。

このセクションで説明した状況は、手動介入の結果です。手動介入の間にアプリケーションのインスタンスが完了していたり、ディスク資源が複数ノードで実行されていたりすると、RMSが初期化される前にデータの不整合が生じている恐れがあります。

2.4 Offline 処理

Offline処理の結果、userApplicationオブジェクトの状態は Offline状態へと遷移します。

2.4.1 Offline 要求

Offline要求は、以下のいずれかの理由で生成されます。

● GUI または CLI (hvutil -f) を使った手動 Offline要求

● GUI または CLI (hvswitch) を使った手動切替え要求

● 障害 (Fault) 発生後の、自動または GUI または CLI (hvutil -c) を使った Offline処理

● GUI または CLI (hvshut) を使った RMS のシャットダウン

運用時では、RMSコマンドインタフェースのみがOffline要求を生成することができます。異常 (Fault)が発生した場合、userApplication は自らの Offline 要求を生成し、問題のあるアプリケーションが動作し続けることを防止します (19 ページの "2.5 Fault 処理 " も参照してください )。この Offline要求は、その後に続く切替えが実施されるための前提条件としても必要な要求です。

userApplicationオブジェクトの Offline処理は、RMS が「hvshut -L」または「hvshut-A」で停止された場合には実行されません。

16 J2UZ-5294-06Z0(03)

Page 25: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

RMS の詳細説明 Offline 処理

2.4.2 userApplication の RMS グラフにおける Offline 処理

Online 処理と異なり、Offline 処理は userApplication グラフノードからリーフノードへとトップダウン形式で行われます。ディテクタが存在しないグラフノードでは、OfflineScript の実行直後に PostOfflineScriptが実行されます。Offline処理の流れを以下に示します。

1. userApplicationが Wait状態に遷移する。

2. userApplication は PreOfflineScriptを実行し、PreOfflineScript の終了後、該当する要求を子へ送信する。

3. PreOffline要求の受信後、子のグラフノードはWait状態へ遷移し、自分のPreOfflineScriptを実行し、要求を転送する。

4. リーフノードでは、PreOfflineScriptの実行が完了すると、該当するメッセージ (PreOffline処理の完了通知 ) を親オブジェクトに転送する。

5. メッセージはそれ以上の処理をすることなく、userApplicationへ到達するまで子から親へと転送される。

6. PreOfflineScriptの処理が完了してから、userApplicationは OfflineScriptを実行し、その直後に PostOfflineScriptを実行する (userApplication自体のグラフノードはディテクタを保持しないため )。

7. userApplicationが実際の Offline要求を生成する。

次に示すように、Offline要求の処理は Online処理と同様に行われます。

● はじめに OfflineScriptを実行する。

● オブジェクトのディテクタによる Offline通知を受けた後、PostOfflineScriptを起動する。

● PostOfflineScriptの完了後、Offline要求をオブジェクトの子それぞれに転送する。

● すべての子から PostOfflineDone メッセージを受信したら、オブジェクトは PostOfflineDoneメッセージを親に送信する。

前述したように、userApplicationは 後に Offlineとなるグラフノードです。 後の子からPostOfflineDoneメッセージを受信すると Offline処理が完了します。OfflineDoneScriptが存在する場合は起動され、ベースモニタは他のノード上の対応する userApplicationオブジェクトに、アプリケーションが Offlineになったことを通知します。

例 3

Offline処理についてさらに詳しく説明します。

1. 例では PreOfflineScriptを持つノードが存在しないため対応する PreOffline要求は appからリーフノードに転送されます。

2. リーフノードは成功メッセージを userApplicationに返します。

3. userApplication は OfflineScript を実行します。これは、この例ではアプリケーションappが停止したことを意味します。オブジェクト appがアプリケーションの監視を行っていないため、RMS は、OfflineScriptの完了により Offline処理が成功したものと判断します。

4. PostOfflineScriptが構成設定されていないため、OfflineScriptが完了すると直ちにOffline要求が andOp1に送信されます。

5. andOp1オブジェクトにはディテクタもスクリプトも存在しません。Offline要求は転送可能です。

6. cmd オブジェクトは、OfflineScript を実行し、オブジェクトのディテクタが Offline 処理の完了を通知するとすぐに、要求を転送します。

7. lfs リーフノードもまた、OfflineScript を実行し、ディテクタから対応した通知を受信した後に成功メッセージを転送します。

J2UZ-5294-06Z0(03) 17

Page 26: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

Offline 処理 RMS の詳細説明

8. appが成功メッセージを受信すると、Offline処理は完了します。

9. Offline 処理が完了すると、OfflineDoneScript を実行します。このスクリプトはクリーンアップまたは情報送信を目的とするスクリプトです。リターンコードが userApplicationの状態に影響することはありません。

2.4.3 Offline 処理中の予期しないレポート

Offline処理中の予期しないレポート(Unexpected report)とは、Offline処理中に通知されるが、BM(ベースモニタ)により無視される Offline 状態以外のレポートのことです。

BM(ベースモニタ)により無視される Offline 状態以外のレポートは、あるオブジェクトが属するユーザアプリケーションの Offline処理が開始してから、そのオブジェクトの Offline処理が成功または失敗するまでの間に通知されることがあります。

なお、オブジェクトの Offline 処理が失敗するケースについては、18 ページの "2.4.4 Offline 処理中のFault" を参照してください。

2.4.4 Offline 処理中の Fault

Offline 処理中にエラーが発生すると、影響するグラフノードは Fault 処理を開始し、親グラフノードにエラーを通知します (19 ページの "2.5 Fault 処理 " も参照してください)。Offline 処理中に異常が発生するのは、以下のような場合です。

a. Offline処理終了時点で、あるリソースオブジェクトのディテクタから 後に報告された状態が Online、Standbyまたは Faulted状態である場合。

b. スクリプトが 0以外の値で終了した。

c. スクリプトが復帰せずタイムアウトになり実行に失敗した。

d. オブジェクトの OfflineScriptが完了し、ディテクタから一定時間内に Offline状態が通知されなかった。

2.4.5 グラフノードがすでに Offline 状態である場合

Offline 処理の開始時に、グラフノードがすでに Offline 状態になっている場合があります。これが発生するのは、通常、親 userApplication が Offline であるノードから Offline 要求が出された場合です ( 親 userApplicationが Onlineであれば、Offline状態のグラフノードはツリーで ORグラフノードの下に表示されます )。 Offlineオブジェクトが Offline要求を受信すると、Online処理の時と同様に、その要求はそのまま転送されます。スクリプトは実行されず、状態は Wait にはなりません。

2.4.6 オブジェクトを Offline 状態にすることができない

RMS は、スクリプトが Offline 状態にできない資源の監視にも対応することができます。たとえば物理ディスクは監視対象とすることはできても、通常は物理的にシャットダウンできないオブジェクトとなります。このような例に対処するため、RMS では真の Offline状態が存在しない資源を LieOffline属性を使ってグラフノードとして表します。RMS Wizard Tools サブアプリケーションはこの属性を、物理ディスクを表す gResource オブジェクトにデフォルトで設定するため、明示的に指定する必要はありません。

Offline処理中、LieOffline属性が設定されたグラフノードは、Pre-OfflineScript、OfflineScript、Post-OfflineScript実行時も他のオブジェクトと同じように動作します。親オブジェクトに関連するオブジェクトの反応もまた同じで、オブジェクトが Offline になったものとして扱われます。LieOffline

18 J2UZ-5294-06Z0(03)

Page 27: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

RMS の詳細説明 Fault 処理

属性が設定されたオブジェクトは、OfflineScript の実行後、ディテクタの Offline 通知を待たずにPostOfflineScript が自動的に実行されます。OfflineScript も実行以後に予期しないディテクタのOnline通知が届いても、この場合は Faulted状態とはなりません。

2.5 Fault 処理

異常 (Fault) 状態の対処は、RMS の も重要な機能です。RMS の障害処理方法は、アプリケーションの状態によって異なります。たとえば、実行中のアプリケーションのRMSグラフで発生した障害 (Fault)は、Offline状態の RMS グラフで発生した障害 (Fault) の対処とは異なります。

2.5.1 Online 状態または要求処理中の Fault

ディテクタが Online 状態のグラフノードの異常 (Fault) を検出し、かつ、そのグラフノード上のuserApplication も Online 状態だった時は、RMS はそのグラフノードの FaultScript を実行します。Online 状態だったグラフノードが Offline 状態となったことがディテクタで検出された場合は、要求が存在しなくても同じ Faulted状態であるとして処理されます。

FaultScriptの完了後、RMS は Faultが発生したグラフノードの親に対して Fault状態を通知します。親グラフノードでも同様に FaultScriptが実行され、Faultメッセージを転送します。

orOpグラフノードの場合は特殊で、子の状態の論理 OR を通知します。OR グラフノードが Faultメッセージに反応するのは、Online状態の子グラフノードが存在しない場合のみです。orOpが Online状態の子グラフノードが存在する場合は、RMS はこの段階で Fault処理を終了します。

orOp グラフノードによる Fault 処理中断がなければ、Fault メッセージは userApplication に到達します。ここで、userApplication は FaultScript を実行します。この処理では、以下のAutoSwitchOverと PreserveStateの属性の組合わせに従って、3 種類の設定が考えられます。

● AutoSwitchOverに ResourceFailureが設定されている

● AutoSwitchOverに ResourceFailureの設定がなく、かつ PreserveState=1 である

● AutoSwitchOverに ResourceFailureの設定がなく、かつ PreserveState=0 であるか設定されていない

AutoSwitchOver に ResourceFailure が設定されている

AutoSwitchOver 属性に ResourceFailure が設定されていると、RMS は PreserveState 属性を無視して AutoSwitchOver 属性だけが設定されているものとして処理を行います。この場合の処理の流れを以下に示します。

1. userApplicationは切替え処理を実行しようと試みます。切替えを行うためには、そのクラスタノード上で userApplicationが Offline状態になっていなければならないため、Offline要求が発生します。

2. Offline処理が完了すると、Online要求がリモートクラスタノードの該当するuserApplicationに送信されます (25 ページの "2.6 切替え処理 " を参照してください )。ただし、通常の Offline要求の場合と異なり、userApplicationは Offline状態ではなく、Faulted状態となります。これにより、再度切替えが行われても、userApplicationが異常の発生したクラスタノードに戻る可能性がなくなります。

Offline 処理中にさらに異常 (Fault) が発生した場合 ( たとえば、Faulted 状態として通知されたグラフノードに対応する資源を、RMS が正常に非活性化 (Offline) できなかった場合など ) は、切替え処理は実行されません。これは、対象資源が未定義状態 ( 使用されているかいないかが判断できない ) と判断されるためです。userApplicationはこれ以上のアクションを起こさず、すべての非強制である外部要求を抑止します。

J2UZ-5294-06Z0(03) 19

Page 28: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

Fault 処理 RMS の詳細説明

Offline処理中に発生した故障 (Fault) は、Double Fault と呼ばれます。

RMS はこの状態 (Double Fault) を解決することができないため、システム管理者の介入が必要となります。この場合、「データ破壊防止は、業務の可用性維持よりも重要」という方針で対処してください。

重要なユーザ業務である場合は、userApplication構成時に、HaltFlag属性を設定することができます。HaltFlag属性が設定されている場合は、Double Fault が発生した場合、Double Fault が発生したクラスタノードは他ノードから強制停止され、RMS は他のノードへ userApplication の切替えを行います。

アプリケーションの Halt 属性が設定されている場合、Double Fault が発生したクラスタノードは、相手ノードから強制停止されます。

AutoSwitchOver に ResourceFailure の設定がなく、かつ PreserveState=1

この場合の処理の流れを以下に示します。

1. FaultScriptの実行後、userApplicationはそれ以上の処理を行わない。

2. 全グラフノードの状態は現在の状態を保持する。

この PreserveState属性は、オブジェクトが監視している対象資源を、アプリケーション自らが修復可能な場合に使用されます。

AutoSwitchOver に ResourceFailure の設定がなく、かつ PreserveState=0 または設定なし

この場合、障害 (Fault) 発生時に Offline処理が実行されます。しかし、Offline処理が成功しても失敗しても切替えは行われません。

切替え要求保留中の Fault

Offline 処理中に切替え要求で障害 (Fault) が発生した場合は、AutoSwitchOver 属性が No に設定されていても障害 (Fault) 発生による Offline 処理の成功、かつ終了後に切替えが行われます。これは、システム管理者によって送信された切替え要求により、切替え要求自体が発生しているためです。現在の切替え要求が指定切替え要求である場合は、切替え先は も優先順位の高いノードではなく、指定切替え要求で明示的に指定されたノードになります。

AutoSwitchOverと PreserveState属性の詳細については、215 ページの "13 付録 — 属性" を参照してください。

20 J2UZ-5294-06Z0(03)

Page 29: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

RMS の詳細説明 Fault 処理

2.5.2 Offline Fault

ノード上のアプリケーションが Online状態でない場合でも、RMS グラフ上でそのノードにアプリケーションが構成されていれば、RMS は監視を継続します。このようなグラフノードの1つで異常 (Fault)が発生し、ディテクタが検出すると、Fault が表示されますが、Fault 処理は行われず、したがって、FaultScriptも実行されません。親グラフノードへのメッセージも送信されません。

この場合、1 つの子オブジェクトが Faultedであっても、andOpオブジェクトは Offline状態となる可能性があります。

これは、userApplicationグラフ内のグラフノード間の必須依存関係は、userApplicationを実行する場合にのみ存在するためです。

2.5.3 AutoRecover 属性

ローカルファイルシステムを表す gResourceオブジェクトは、復旧が簡単で、かつ、Faulted状態に陥りやすいオブジェクトの一例です。グラフノード自体に発生する障害 (Fault) の原因は、ディスクのI/O エラーを除けば、ほとんどの場合は管理者による umount(1M) の誤操作が原因です。この場合、userApplication全体を切替えることは、 善のリカバリ処理とは言えません。したがって、Fault処理が 適な解決策でもありません。

このような場合の対処としては、管理者がオブジェクトの AutoRecover 属性を設定する方法が考えられます。AutoRecover 属性を設定したオブジェクトが Online 状態で異常 (Fault) が発生すると、FaultScript の実行前に OnlineScript が実行されます。OnlineScript の実行後、一定時間内にオブジェクトが Online状態になれば、Fault処理は行われません。

障害 (Fault) の原因がグラフノード自身にある場合、つまり、子のグラフノードの障害 (Fault) が原因ではない場合は、RMS は AutoRecover 属性のみを評価します。したがって、RMS はディテクタが存在するグラフノードの AutoRecover 属性のみを評価することになります。なお、各種要求の処理中、または、グラフノードが Offline状態で障害 (Fault) が発生した場合は、AutoRecover属性による復旧は行われません。

2.5.4 Offline 処理中の Fault

Offline 処理中に障害が発生しても、グラフノードの Offline 処理が直ちに停止することはありません。その時点のツリーの Faulted状態が保存され、リーフノードに到達するまで通常の Offline処理が継続します。しかし、成功または失敗のメッセージが上方の userApplication に向けて伝播され、途中でそのグラフノードに到達した時点で、この障害は再現されて処理されます。この方法により、障害を発生直後に処理することによって生じる競合状態の発生を回避することができます。

2.5.5 Fault 処理の例

Fault処理の例を以下に示します。

例 4

この例での処理の流れは次のとおりです。

● アプリケーション app は、AutoSwitchOver 属性が No に設定され、ノード fuji2RMS 上でOnline状態にあります。

● 要求はありません。

● lfsオブジェクトには AutoRecover属性が設定されていません。

● システム管理者の誤操作により、lfsファイルシステムがアンマウントされました。

J2UZ-5294-06Z0(03) 21

Page 30: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

Fault 処理 RMS の詳細説明

Fault処理は次のとおりです。

1. lfsオブジェクトの gResourceディテクタは、そのオブジェクトが Offline状態であることを検出します。対応する userApplicationが Onlineであり、かつ Offline要求が存在しないため、RMS はこの Offline通知を障害 (Fault) であると判断し親 cmdに通知します。

メッセージ : 予期しない Offline状態は障害 (Fault) になります。

2. この例の cmd オブジェクトには、FaultScript は存在しません。cmd オブジェクトは直ちにFaulted状態になり、その障害 (Fault) を親に通知します。

3. andOp1 にも FaultScript がないため、直ちに Faulted 状態に移行し、その障害 (Fault) を親 appオブジェクトに通知します。

4. app オブジェクトは、Faulted 状態になり、AutoSwitchOver 属性が No 以外に設定されているため、切替えに備えて Offline処理を開始します。

5. この例では、ローカルファイルシステム lfsマウントポイント /mntを使用し、OfflineScriptlfsは、単純命令 umount /mntで構成されているものとします。/mntは、すでにマウントされた状態にないため、OfflineScriptは終了コード 0以外で終了します。

6. したがって、RMS の Offline 処理は障害発生後に失敗します。ローカルの状態が依然明確でないため、切替えはできません。RMS は、システム管理者の介入を待ちます。

lfs に、より複雑な OfflineScript を使用すればオブジェクトがマウントされているかを確認して、終了コード 0 で終了することも可能です。この場合、RMS は障害発生後 fuji3RMS に切替えを行ってから、Offline 処理を正しく終了することができます。fuji2RMS 上の全ノードはそれから、Online処理が成功した後に Offline状態になり、appだけが、Faulted状態のまま残ります。

例 5

シナリオは、AutoRecover属性が lfsオブジェクトに設定されていることを除いて、と同じです。

Fault処理は次のとおりです。

1. lfsオブジェクトの gResourceディテクタは、そのオブジェクトが Offline状態であることを検出します。対応する userApplicationが Onlineであり、かつ Offline要求が存在しないため、RMS はこの Offline通知を障害 (Fault) であると判断し、通知を行います ( 上記を参照 )。

2. AutoRecover属性が設定されているため、RMS が親 cmdオブジェクトに直ちに障害 (Fault) を通知することはありません。RMS は、lfs オブジェクトの OnlineScript を実行し、アンマウント処理が行われる前の状態に戻します。

3. 数秒後に lfs オブジェクトの gResource ディテクタから、オブジェクトが Online の状態に戻ったことが通知されます。RMS は、オブジェクトを Online 状態に戻し、それ以上の Fault処理は行いません。

例 6

この例では、appが Online要求を受信しますが、lfsで表されたファイルシステムは破損しています。

Fault処理は次のとおりです。

1. 要求により Online処理が開始します。

2. lfsオブジェクトは OnlineScriptを開始し、0 以外の終了コードで処理が終了します。

3. 次に、lfsオブジェクトは Fault処理を開始します。FaultScriptが用意されていればそれを実行したうえで、Faulted状態に移行し、RMS に障害 (Fault) を通知します。

4. この他の処理は、上記で説明した方法と同様に行われます。

22 J2UZ-5294-06Z0(03)

Page 31: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

RMS の詳細説明 Fault 処理

AutoRecover属性が設定されていても、この場合の Fault処理は同じです。この属性はア

プリケーションが、安定した Online状態にある場合、すなわちアプリケーションが

Online状態で、かつ保留中の要求がない場合にのみ意味を持ちます。

2.5.6 Fault クリア

Fault 処理が成功すると、userApplication 配下の全グラフノードは Offline 状態となり、userApplicationオブジェクトのみが Faulted状態となります。障害により Offline処理が失敗した場合や、アプリケーションの PreserveState属性が設定されている場合、グラフの少なくとも一部は Offline以外の状態すなわち Online、Standby、Faultedのいずれかになります。

このような状態では、userApplicationのノードへの切替え要求はすべて抑止されます。これは、RMSBM ( ベースモニタ ) からは Wait状態で制御不能であるグラフノードが存在するためです。システム管理者は、障害 (Fault) の原因を取り除いた後、RMS を通常の動作に戻すため以下のいずれかの手順でベースモニタに通知します。

1. 次のコマンドを使用して userApplicationオブジェクトとグラフノードの Faulted状態をクリアすることができます。

hvutil -c userApplication

このコマンドは親アプリケーションとそのグラフを矛盾のない状態に変更することによってFaultのクリアを行います。アプリケーションオブジェクトがOnline状態である場合は、Online処理が開始され、アプリケーションオブジェクトが Offline 状態の場合は、Offline 処理が開始されます ( ユーザにはどちらの処理が開始されるかが通知され、その時点で処理の中止を選択することができます )。アプリケーションにつながるすべてのブランチが、Online 状態またはOffline状態に揃った時点で Faultのクリアは完了します。 終状態が Offlineであれば、システム管理者は切替え要求を行い、userApplicationを Online状態へ遷移させることができます。

userApplication オブジェクトが Online 状態であった場合、「hvutil -c」を起動しても、ツリー内の一部のオブジェクトが処理されない場合があります。ツリー全体を Offline状態にするには、以下で説明するように「hvutil -f」を使用します。

2. 次のコマンドは、Offline要求を userApplicationオブジェクトに送信します。

hvutil -f userApplication

このコマンドを実行すると、アプリケーションの Offline処理が開始されます。コマンドの実行が完了すると、アプリケーションとグラフのすべてのオブジェクトが Offline 状態に変更され、Faultはクリアされます。その後必要に応じて、システム管理者は切替え要求を行い、userApplicationを Online状態へ遷移させることができます。

J2UZ-5294-06Z0(03) 23

Page 32: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

Fault 処理 RMS の詳細説明

2.5.7 SysNode 異常

RMS は、SysNodeで発生した異常 (Fault) を、他のグラフノードで発生した異常 (Fault) とは別の方法で扱います。SysNode異常は以下の場合に発生します。

● SysNodeディテクタが RMS BM ( ベースモニタ ) と通信できなくなった場合。

● CF LEFTCLUSTERイベントが発生した場合。

上記のいずれかの状態が発生した場合、RMS は、自動切替えを行う前に、まず通信不可となったクラスタノードが停止されていることを確認します。この確認のために、RMS はシャットダウン機構 (SF) に対して該当クラスタノードの強制停止を依頼します。SF の詳細については、"Cluster Foundation 導入運用手引書 " を参照してください。

SF により、クラスタノードが停止されていることを確認されると、停止されていることが確認できたクラスタノード上で Online 状態であり、AutoSwitchOver 設定に Hostfailure を含むすべてのuserApplicationオブジェクトが、正常に動作している切替え先ノードに対して優先切替えを行います。

例 7

この例での処理の流れは次のとおりです。

● RMS は、それぞれが、SysNodeオブジェクトの fuji2RMSと fuji3RMSで表される 2 つのノード、fuji2と fuji3とで構成されるクラスタ上で実行されています。

● app は、fuji2RMS 上で Online 状態にあり、AutoSwitchOver 属性には HostFailure が設定されています。

● fuji2上でシステム障害が発生し、panicメッセージが表示されます。

RMS の反応は次のとおりです。

1. CF は、ノード障害が発生したと判断し、LEFTCLUSTERイベントを作成します。

2. ノードディテクタは、ノードが Faulted 状態にあると通知し、SysNode を Wait 状態に移行させます。RMS は LEFTCLUSTERイベントを受信すると SF に停止要求を送信します。

3. SF がノードの停止に成功すると DOWNイベントが送信されます。

4. RMS は、DOWN イベントを受信し SysNodeを Faultedとマークします。

5. fuji2RMSオブジェクトは FaultScript ( 構成されているものとします ) を実行します。

6. fuji2RMSオブジェクトは、userApplicationオブジェクトに fuji2RMSが失敗したことを通知します。app は、fuji2RMS に障害が発生した時点で fuji2RMS 上で Online であり、AutoSwitchOver 属性に HostFailure が設定されているため、fuji3RMS 上のオブジェクトappは Online処理を開始します。

2.5.7.1 オペレータ介入

SF がノードの停止作業を行っている間に、SysNodeオブジェクトの Wait状態の継続期間が、オブジェクトの ScriptTimeoutを超過した場合、RMS は ERRORメッセージを switchlog にその旨を記録します。

この時点で未定義の状態のクラスタノードが 1 つ生じたことになるため、RMS は他のすべてのノードでそれ以上の処理を停止します。この状態を解決するには " Cluster Foundation 導入運用手引書 " で説明したように、通常、オペレータの介入が必要になります。処理が完了すると、CF が DOWN イベントを送信し、RMSは処理の停止を解除し、通常の運用が再開されます。

ScriptTimeout属性の詳細については、215 ページの "13 付録 — 属性 " を参照してください。

24 J2UZ-5294-06Z0(03)

Page 33: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

RMS の詳細説明 切替え処理

2.6 切替え処理

切替え処理は、クラスタシステムを構成する他のノードへ userApplicationを切替えます。

2.6.1 切替え要求

切替え要求は、以下の種類に分類されます。

● 優先切替え要求 — RMSは、構成プロセス中に記載されたクラスタノードの優先順位リストに従って、切替え先ノードを特定します。

● 指定切替え要求 — ユーザが切替え先ノードを指定します。

切替え処理により実際に行われる「切替え」は、以下の種類に分類できます。

● 切替え (Switchover) — あるクラスタノード上で実行されている userApplicationを他のクラスタノードへ切替える場合です。

● Online切替え (Switch-online) — userApplicationがどのクラスタノードでも実行されていない時、または、以前動作していたクラスタノードで異常が発生した時に userApplicationを起動する場合です。

切替え処理中、RMS はクラスタシステムを構成する全ノードに対して切替え処理を行っていることを通知します。この処理により切替え要求の競合を防いでいます。

例 8

この例での処理の流れは次のとおりです。

● appは fuji2RMS上で Onlineになっている。

● システム管理者は、appを fuji3RMSに切替えるため、指定切替え要求を fuji3RMSで送信する。

切替え処理は次のとおりです。

1. fuji2RMSが userApplicationオブジェクト上の Onlineノードであるため、RMS は切替え要求を fuji2RMSに転送します。

2. fuji2RMS上の appは、クラスタ内の対応するノード ( この場合は fuji3RMS上の app) に切替え処理が起動中であるとの通知を送ります。これにより処理の競合が防止されます。

3. fuji2RMS上の appは、fuji3RMS上の appに対して、fuji3RMS上のローカルグラフで何らかの障害が検出されているかを確認するよう要求します。この例では、fuji3RMS 上のグラフでは検出された障害はありません。

4. fuji2RMS上の appは Offline処理を開始します。

5. RMS は fuji2RMS上で appの構成解除を完了すると、fuji2RMS上の appがクラスタ内の対応する全ノードに対して、アプリケーションがこれから fuji3RMS上で実行される旨の通知を行います。切替え要求の競合抑止も同時に停止されます。

6. fuji2RMS上のappは、明示的なOnline要求をfuji3RMS上のappに送信して動作を停止します。

7. fuji3RMS上の appは、Online処理を開始します。

J2UZ-5294-06Z0(03) 25

Page 34: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

アプリケーションのリソース障害処理 RMS の詳細説明

2.7 アプリケーションのリソース障害処理

本バージョンでは未サポートです。

グラフ内でリソースの障害が発生した場合、userApplication の AutoSwitchOver 属性が自動復旧処理を制御します。処理の内容は AutoSwitchOver設定に含まれたオプションによって決まります。

ローカルのリカバリは Recoverと OfflineRecoverオプションにより決定されます。

● ローカルの Online処理を再起動 : Recoverが指定されている場合

● ローカルの Offline処理に続いてローカルの Online処理を起動 : OfflineRecoverが指定されている場合

別ノードへの切替えは ResourceFailureオプションで指定します。

● 他ノードへのフェイルオーバ : ResourceFailureが指定されている場合

● アプリケーションのOffline化: ResourceFailureが指定されておらず、かつ、PreserveState属性が 0に指定されている場合

● 何もしない : ResourceFailure が指定されておらず、PreserveState 属性が 1 に指定されている場合

ResourceFailure、Recoverおよび OfflineRecoverオプションは、以下の例のようにシンボリック OR ( 縦線 [|]) 構文を使用して他の AutoSwitchOverオプションと組み合わせることが可能です。

AutoSwitchOver=HostFailure|ResourceFailure|Recover

Recoverおよび OfflineRecoverオプションは相互に排他的です。同時に指定することはできません。ただし、いずれか一方を ResourceFailureオプションと組み合わせることは可能です。この場合、ローカルのオートリカバリが失敗すると、ResourceFailureの設定にしたがって別のノードで処理を再試行します。

Recoverおよび OfflineRecover処理の詳細についてはこの後説明します。

2.7.1 Recover オプションによる Online リカバリ

グラフ内のリソース障害が userApplication に伝播されると、Online 処理が直ちに、( 再 ) 始動されます。処理の内容は管理者が hvswitch -fによって「強制 Online 要求」を発行した場合と同じです。通常の Online処理のルールはすべて適用されます。なお、すでに Onlineの状態にあるすべてのオブジェクトは要求を伝播させますが、自らの Onlineスクリプトは起動しません。

● Online処理が成功すると userApplicationは Online状態に戻ります。フェイルオーバ処理はそれ以上起動されません。

● Online 処理が失敗した場合、userApplication では、その他の属性の設定に従って通常の障害処理が開始されます。

2.7.2 OfflineRecover オプションによる Offline リカバリ

グラフ内のリソース障害が userApplicationに伝播されると、Offline処理が直ちに、( 再 ) 始動されます。処理の内容は管理者が hvutil -c によって「クリア要求」を発行した場合と同じです。通常の Offline処理のルールはすべて適用されます。

● Offline処理が成功すると直ちに Online処理が開始します。処理の内容は管理者が hvswitchによって「非強制の Online 要求」を発行した場合と同じです。通常の Online処理のルールはすべて適用されます。

26 J2UZ-5294-06Z0(03)

Page 35: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

RMS の詳細説明 特殊な状態

● Online 処理が失敗した場合は、userApplication のその他の属性設定に従って、通常の障害処理が開始されます。

● ただし Offline 処理がすでにいったん起動して失敗している場合は、二重障害と判断されます。これは通常、Offline処理が、前のリソース障害発生以後グラフを正しい Online状態に戻せなかったことを意味します。

この場合には、通常の二重障害のルールが適用されます。特に、これ以上の Online 処理は開始せず、またフェイルオーバも行われません。システム管理者による介入が必要です。Halt属性が設定されている場合は、ノードが強制停止させられます。

2.7.3 追記

userApplication が Standby 状態にあった場合も上記のルールが適用されます。唯一の違いは、Online処理の代わりに Standby処理が起動される点です。

単一リソースオブジェクトのオートリカバリ同様、userApplication が正しく Online 状態またはOffline状態にあった場合にのみ、userApplicationのオートリカバリは起動されます。ただし、進行中のOnline処理、Standby処理、Offline処理またはFault処理が失敗した場合には起動されません。

userApplication のオートリカバリ処理は、成功した場合も失敗した場合もすべて switchlog に記録されます。

2.8 特殊な状態

2.8.1 保守モードの制限

保守モードのアプリケーションが存在すると、同一グラフ内の他のオブジェクトは処理上の制限を受けます。この制限により、本章で前述したすべての処理が停止され、以下のオブジェクトに影響が生じます。

● 保守モードにあるアプリケーションのすべての子オブジェクト

● 保守モードのアプリケーションが存在するノードとその上位ノード

処理要求の種類によっては、制限があるためにエラーまたはタイムアウトのいずれかが発生する場合があります。

制限がどのように適用されるかを理解するため、2 つのアプリケーション (app1および app2) が、それぞれ1つずつ依存資源 (Res1 および Res2) を持ち、2 つのノード (NodeA および NodeB) のいずれでも実行されるような構成を使って説明します。図 4 は、app1が保守モードになった場合の、オブジェクトの状態を示しています。

図 4: 保守モード時の制限の例

J2UZ-5294-06Z0(03) 27

Page 36: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

特殊な状態 RMS の詳細説明

この例は以下の機能について説明しています。

● アプリケーションの保守モードは、アプリケーションが Online 化される可能性があるすべてのノード、すなわち PriorityList 属性に記載されたすべてのノードに適用されます。 このため、app1 は実行の可能性があるノードにおいては、そのノードでの以前の状態に関係なく、すべてMaintenance状態にあります。

app1には各ノードにおける目標状態が設定されています。 これは、アプリケーションが保守モードを抜けた後のあるべき状態です。 目標状態は、GUI または CLI の hvdisp で、アプリケーションの StateDetails パラメタによって確認できます。

● Res1は app1の子であるため、いかなる場所においても制限を受けます。

● app1が、NodeAと NodeBのいずれのグラフにも現れるため、両者にも制限があります ( いずれのノードでも RMS の停止処理を開始すると、RMS が app1 の保守モードを停止するのを待ってから、停止処理を実行することを求められます )。

● app1は、app2のグラフには表示されません。したがって、app2の Offline化や Online化、別ノードへの切替えなど、app2とその資源に関する通常の処理は許可されます。

● クラスタアプリケーションが保守モードに入った状態で、RMS やシステムを停止しないでください。停止する場合は、必ずすべてのクラスタアプリケーションの保守モードを終了してから行ってください。

すべてのクラスタアプリケーションの保守モードを終了せずに、force オプションを使用してRMS を停止すると、オフライン処理が実行されない状態で OS が停止します。このため、RMS 再起動時、GDS 論理ボリュームのように、リソースの状態に影響がでる場合があります。

上記の内容は「hvutil -m on」または、各アプリケーションを右クリックしてから、GUI を使ってアプリケーションの保守モードを開始した場合の制限です。これとは別に、「hvutil -M on」が使用された場合や、ノードを右クリックして GUI を使って処理を開始した場合は、保守モードがクラスタ全体に適用され、すべてのノードで処理が停止します。

2.8.2 Inconsistent 状態

ある userApplication とそのグラフ内の 1 つ以上のリソースが Offline 状態または Faulted 状態にあり、同時にグラフ内の他のリソースが Online 状態または Faulted 状態にあるという状況が発生する場合があります。これは、管理者の手動操作による介入があった場合や、Faultクリア処理の失敗により、オブジェクトのいくつかが Online状態または Faulted状態で残った場合に起こります。

そしてこの場合、これらのOnline状態またはFaulted状態のリソースオブジェクトにClusterExclusive属性が設定されていると、複数のノードで同時にOnline状態になることはできません。userApplicationが単に Offlineまたは Faultedとマークされている場合であれば、その userApplicationはリソースとともに他のノードに切替えられて Online 状態になることができます。しかしこれは ClusterExclusive 属性の意図する動作とは矛盾し、その結果生じるリソースの競合によりデータの破損が生じる可能性があります。このような問題を回避するため、RMS は、userApplication に Offline や Faulted ではなく、Inconsistentとマークを付けることによって userApplicationの切替えをすべて禁止しています。正確な定義は以下のとおりです。

● 実際には Offline 状態、Standby 状態または Faulted 状態にある userApplication にInconsistent 状態のマークが付けられ、かつ、そのグラフ内で 1 つ以上のオブジェクトがOnline状態または Faulted状態にあり、そのオブジェクトの ClusterExclusive属性が 1 に設定されている。

userApplication は、Inconsistent の状態にあると表示または報告されますが、実際の状態は、Offline、Standby または Faulted です。ほとんどの処理においては、Inconsistent 状態にあるuserApplicationの動作は、実際の状態に基づいて決定されます。たとえば、実際の状態が Offlineの場合には、Offline 要求が発行されても Offline スクリプトは起動されません (18 ページの "2.4.5グラフノードがすでに Offline 状態である場合 " を参照してください )。

28 J2UZ-5294-06Z0(03)

Page 37: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

RMS の詳細説明 RMS ハートビート

例外は不整合の userApplicationをリモートノードに切替える要求が発行された場合で、この要求は拒否されます。これによって、ClusterExclusive リソースが、一度に 1 つのノードでのみ Onlineになることが確保され、障害が発生する可能性が回避されます。

ある userApplication が、1 つのノードでのみ Inconsistent 状態にある場合は、そのノード上でOnline状態にすることは可能です。ただし、複数のノードで Inconsistent状態が生じていると切替えはできません。この場合、たとえば、hvutil -fまたは hvutil -cによって、すべてのリソースをOffline状態にするなどして、まず Inconsistent状態を解決する必要があります。

userApplicationが複数のノードで Inconsistent状態にある場合、ClusterExclusiveリソースのいずれかが、複数のノードで Online 状態にある可能性があります。この場合には、userApplicationに対して hvutilコマンドを実行する前に、各ノードでリソースを正常終了させるための適切な処理を行ってください。リソースのタイプによっては、データの破損が生じていないかを確認する必要があります。

2.9 RMS ハートビート

RMS がノードの状態を監視する際に も優先する検出項目は、ノードもしくは RMS ベースモニタが障害によって完全に停止しているかどうかです。応答速度の低下は、システムの過負荷によって生じている可能性がありますが、 優先の検出項目ではありません。RMS はこれらの障害の検出に 2 種類の方法を採用しています。

1 つめはハートビートを使用する方法です。RMS は UDP ハートビート信号を定期的に送信しています。後のハートビート送信時からの応答時間が、設定された接続タイムアウト値を超えた場合に、RMS は

ノードとの接続が失われたと判断します (228 ページの “HV_CONNECT_TIMEOUT” を参照 )。RMS はここでノードのリカバリ期間に入ります。ノードのハートビートがリカバリ期間中に検出されれば、RMSはノードの機能が回復し、正常な状態に戻ったと判断します。しかし、リカバリ期間終了時までにノードからのハートビートを受信しなかった場合は、そのノードとの間で他の通信が可能な場合でも、RMSはノードが DOWN 状態にあると判断します。

RMS はノードが DOWN 状態にあると判断すると、アプリケーションとクラスタの整合性を保証するための処理を開始します。処理の 初に、ノードが本当に停止しているかを確認する必要があります。停止していなかった場合には、後にノードとノードのアプリケーションが予期せず回復し、競合やデータ破損が生じる恐れがあります。このような問題を避けるため、RMS はシャットダウン機構 ( 後述 ) を使用してノードの強制停止を行います。これは通常、ノードの再起動や電源切断によって行われますが、正確にはどのシャットダウンエージェントがそのノードに割り当てられているかによって決まります。ノードが強制停止されてはじめて、RMS はそのノードのアプリケーションをクラスタ内の別のノードで安全に再起動できるようになります。障害が発生しているノードから正常なノードにアプリケーションを自動的に切替える処理を、アプリケーションのフェイルオーバと呼びます。フェイルオーバと呼びます。

アプリケーションの切替えはクラスタの性能に影響を与えるため、ノード停止の検出を誤らないようにリカバリ期間の設定を適切に行うことが重要です。 適な UDP リカバリ期間はクラスタの状態によって異なります。ノードやベースモニタの故障対応に重点を置くなら、リカバリ期間が短いほうが適しています。しかし、過負荷が生じたノードからの応答は遅くなることを考えると、リカバリ期間を長くしておいたほうが不必要なシャットダウンは避けられます。UDP を単独で使用すると、これらの相反する要求によって、大規模なクラスタや負荷の大きいクラスタでは、リカバリ期間の調整が困難になります。CF が存在しない場合は、SAP クラスタと同様、RMS は上記 2 つの条件をともに考慮して、中間のリカバリ期間を採用しています。ただし、管理者は RMS の起動時に値を変更することができます (hvcm のマニュアルページを参照してください )。

UDP では障害発生の原因となりうる場合が 3 つあるため、信頼性に欠けるので注意が必要です。1 つめは、応答を要求する送信がリモートノードに到達しない場合です。この場合当然応答は返されません。2 つめはリモートノードの負荷が大きい場合です。この場合はリカバリ時間内に応答できない可能性がありま

J2UZ-5294-06Z0(03) 29

Page 38: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

RMS ハートビート RMS の詳細説明

す。応答時間が低い値に設定されている場合には、この危険はさらに大きくなります。3 つめは応答パケットがリモートノードからネットワークに送り出されても、何らかの理由でローカルノードに到達しない場合です。上記いずれの場合でも、ローカルノードはリカバリ期間経過するまで処理ができなくなります。

クラスタの応答性を高めるために、RMS ではマシンの状態と接続状況を確認する手段として、ELM(Enhanced Lock Manager) を使用します。ELM はポーリングを行いません。ELM は、CF がカーネルレベルで管理するロックをもとに判定を行います。ノードは、クラスタに参入するとロックを作成し、ベースモニタの作動中はそのまま保持します。このロックは、ノードまたはベースモニタが停止した時点で解放されます。ロックの状態は CF によってバックグラウンドで保持されるため、各ノードの RMS はローカルにロックの状態を参照できます。

ELM はノードまたはベースモニタの障害検出を優先するよう設計されています。このため、リカバリ時間を比較的大きな値に設定して、UDP ハートビートをノードの応答速度低下の検出に 適化させることができます。UDP ハートビートは ELM を補完します。CPU またはネットワークインタフェースに過負荷のかかったノードは応答が遅くなりますが、CF はノードのロックの状態を保持し続けます。この状態が続くと、 終的には UDP ハートビートのリカバリ期間が経過し、RMS がノードの停止処理を開始します。ELM により、RMS がノードの停止処理を開始する確率は非常に低くなります。

ELM の手動停止は、システムに詳しい専門家により、ローリングアップデートまたはデバッグの場合にのみ行ってください (226 ページの “HV_USE_ELM” を参照 )。この場合はさらに、RMS が起動してから、hvcm -h <timeout> を使用して UDP ハートビートリカバリのタイムアウト時間をより小さな値に手動設定する必要があります。これは、ELM が停止している場合に、リモートのベースモニタとノードの停止を効率的に検出するために必要です。

2.9.1 動作の詳細

ELM のメカニズムはいくつかの簡単な例を用いると理解が容易です。以下に、2 つ以上のノードで構成されるクラスタ ( ノード A、ノード B、ノード C 等 ) を例に説明します。

2.9.1.1 ELM ロックの管理

各ノードのロック名は RMS<nnnnnn> の形式で命名されています。<nnnnnn> は 6 桁の CF ノード ID です。このため、各ノード名とノード ID およびロック名との対応が簡単に分かります。ロックは CF によってクラスタごとに管理され、どのノードからどのロックに対してもアクセスを要求することができます。

あるノードがロックに対してはじめてのアクセス要求を行った場合、要求は直ちに許可されます。これは、ノードが 初は NULL 状態で要求を受信するためです。これは特別な中立の状態であり、他のいかなるノードにおけるそのロックの状態とも競合しません。ローカルノードはここで ELM に対し、ロックを別の状態に変更するよう要求できます。いったん要求が許可されると、ノードはその状態を維持することも、別の状態に変更することもできます。ただし、可能な処理はこの 2 つのみです。

ELM がサポートする状態は NULL 状態以外には以下の 2 つだけです。

● concurrent read (CR) — 複数のノードがロックをこの状態で保持できます。これは他のノードがロックを exclusive 状態に変更することを防止します。

● exclusive (EX) — クラスタ内で 1 つのノードのみがロックをこの状態で保持できます。これは他のノードがロックを concurrent 状態または exclusive 状態に変更することを防止します。

変更の処理は ELM の中心的な制御メカニズムです。他ノードとの競合が発生する変更を要求してもエラー状態は発生しません。その要求は ELM が要求を許可できるようになるまで、キューに入れられます。要求しているプロセスは Wait 状態に置かれ、再活性化されることにより、その時点で、要求が許可されたことが分かります。

ノードがロックを NULL 状態に戻すと、そのロックは解放されます。これにより、他のノードがロックを目的の状態に変更できるようになります。要求はキューに入れられた順序で許可されます。

30 J2UZ-5294-06Z0(03)

Page 39: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

RMS の詳細説明 RMS ハートビート

たとえば、A がロックを EX 状態に変更したとします。B は A のロックにアクセスを要求することが可能です。B は直ちに NULL 状態のロックを受信します。B がここでそのロックを CR 状態に変更するように要求を発行すると、その要求は A ( もしくは ELM 自身 ) がロックを NULL または CR 状態に変更するまで待ち状態になります。これは、どちらも B の要求と競合しないためです。このようにして B が Aのロックの変更を完了すると、その時点で、BにはAがロックをEX状態に保っていないことが分かります。

他のノードのロックへのアクセス要求が直ちに許可され、ELM のロックメカニズムに影響を与えないため、このステップは以下の説明では省略します。

2.9.1.2 初のノードの起動

RMS を起動する 初のノードを A とします。以下の処理が行われます。

1. A は自らのロックを EX モードに変更します。他のノードはこの時点ですでに起動処理を完了しているため、これは直ちに実行されます。

2. A は UDP ハートビートを起動し、他ノードからの応答を待ちます。この時点ではまだ他ノードのロックの変更要求を出しません。

2.9.1.3 2 番目のノードの起動

RMS を起動する 2 番目のノードを B とします。以下の処理が行われます。

1. B は自らのロックを EX モードに変更します。A はこの時点ではまだ B のロックに対するアクセス要求をしていないため、モードの変更は直ちに実行されます。

2. B は UDP ハートビートを起動し、他ノードからの応答を待ちます。この時点ではまだ他ノードのロックの変更要求を出しません。

3. A は 初のハートビートを B から受信します。A は B のロックを CR 状態に変更するように要求を発行します。B はロックを EX 状態に維持しているため、A の要求は ELM キューに入って休眠します。

4. A の要求が休眠状態にあるため、B は自らのロックを保持しなければなりません。このため、B はOnline 状態であることが必要で、A は B にその状態のマークを付けます。A は自らの要求が休眠状態を続ける限り、B の Online状態のマークを維持します。

5. B は A からのハートビートを検出し、同じ処理を実行します。B は A のロックを CR モードに変更しようとします。しかし A はロックを EX 状態に維持しているため、B の要求は ELM キューに入って休眠します。

6. B の要求が休眠状態を続ける限り、B は A の Online状態のマークを維持します。

この時点で、2 つのノードとも自身のロックを EX 状態に保ち、それぞれ相手方のロックを CR 状態に変更するように要求を発行しています。両者の要求とも休眠状態にありますが、このことは、両ノードが実行している処理以外に対しては何の影響も与えません。しかし、各ノードで要求の処理が完了していないといういうことは、他方のベースモニタが Onlineであるということを示しています。

2.9.1.4 3 番目以降のノード

RMS を起動する 3 番目のノードを C とします。A および B との間で行われる処理は、上記 2 番目のノードの起動時と同様です。

1. C は自らのロックを EX 状態に変更し、ハートビートを開始し、他のノードからのハートビートを待ちます。

2. C は、他ノードの 1 つから 初のハートビートを受け取った時点で、そのノードのロックを CR 状態に変更しようとしますが、要求は休眠状態に入ります。

3. 要求が休眠状態を続ける限り、C は、他ノードの Online状態のマークを維持します。

C はあるノードから 初のハートビートを受け取ると、必ずステップ 2 と 3 を実行します。

J2UZ-5294-06Z0(03) 31

Page 40: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

RMS ハートビート RMS の詳細説明

同時に、Online状態にある他のノードは C の 初のハートビートを受信し、C のロックについてステップ 2 と 3 を実行します。

クラスタ全体が Online状態になった時点で、各ノードのロックは次の状態になっています。

● ノードは自らのロックを EX 状態に保っている。

● ノードは、他のノードのロックを CR 状態に変更する要求を発行済みであり、これらの要求はすべて休眠状態にある。

2.9.1.5 ノードまたは RMS 停止の順序

CF がリモートノードの LEFTCLUSTER イベントを発行した場合、または、リモートノードのベースモニタが停止した場合、ELM は、そのノードのロックをクラスタ内のすべてのノードで NULL 状態に変更します。

たとえば、ノード B が停止したと仮定します。ノード A 上では以下の処理が行われます。これは他のオンラインノードでも同様です。

1. B のロックを CR 状態に変更するという A の要求が待機状態を脱します。その結果、A はそのロックを CR 状態で維持します。

2. A はロックを NULL 状態に変更し、B のマークを Offline状態にします。

3. A は B からハートビートを受信するまで、B のマークを Offline状態で維持します。ハートビートを受信した時点で、A は B のロックを CR 状態に変更する要求を発行してロックサイクルを再始動します。

ノード B のベースモニタが 初に停止した場合も、同様の処理が行われます。大きな違いは、ノードが停止した場合は、LEFTCLUSTER イベントが ELM ロックのリリースに先行し、ベースモニタが停止した場合は、ELM ロックのリリースが LEFTCLUSTER イベントに先行する点です。いずれの場合にも、RMSはノードの強制停止を開始します。

クラスタ内で何らかの故障が発生した場合に、ELM は他のベースモニタに対して能動的に警告を発します。ハートビートのタイムアウト時間が経過するのを待つ必要はありません。

ただし、通常終了の場合でも、ELM はほぼ同じような動作をしますが、その場合はノード自身がロックを解放します。また、RMS のレベルでは、ノードの強制停止は必要ありません。

2.9.1.6 レスポンスの遅延

リモートノードがビジー状態にある場合、そのベースモニタの反応は非常に遅くなります。ELM は状態ベースの監視方法であり、この状態を検出できません。このため、リモートノードの反応遅延が許容範囲を超えた場合は、RMS は時間ベースの UDP ハートビートを使用します。

たとえば、ノード B は停止してはいませんが、ベースモニタの反応が非常に遅いとします。クラスタ内のあるノード ( この例ではノード A) で次の処理が行われます。

1. B のロックを CR 状態に変更するよう求める A の要求は、sleep 状態を続けます。これは B が引き続き動作中のためです。

2. B のハートビート期間 ( デフォルトは 30 秒 ) が経過し、さらに、ハートビートリカバリ期間 ( デフォルトは 600 秒 ) が経過します。

3. ハートビートが失われたため、A は SF に B を強制停止するよう指示します ( ただし、ELM は依然として問題を検出していません )。

4. B の強制停止が完了すると、ELM はすべてのノードでロックを解放します。

5. A が発行した B のロックの変更要求は許可されます。A は直ちにロックを解放し、B のマークをOffline状態にします。

6. A は B のハートビートを待機し、ロックサイクルが再開します。

32 J2UZ-5294-06Z0(03)

Page 41: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

RMS の詳細説明 RMS ハートビート

他のノードは、自らのロック要求が休眠状態を脱する前に、B のハートビート喪失を検出する可能性があります。この場合にも、B の強制停止を開始します。

これが、ELM が UDP ハートビートをバックアップとして必要とする理由です。UDP が稼動していない場合、ELM ロック要求は、リモートノードのサービス停止後もかなりの時間キューに残ることになります。

2.9.2 hvenv のデフォルトの初期化

hvenv の HV_USE_ELM 環境変数は CF の状態に応じて自動的に初期化され、ELM を有効化または無効化します。

● CF がインストールされていない場合は、HV_USE_ELMは 0 に設定され、デフォルトの UDP ハートビートリカバリタイムアウトは 45 秒です。

● CF がインストールされている場合は、HV_USE_ELMは 1 に設定され、デフォルトの UDP ハートビートリカバリタイムアウトは 600 秒です。

デフォルトのリカバリタイムアウトは hvcm -hで変更できます。

ハートビートリカバリタイムアウトが短すぎると、ELM が稼動中であってもノードが処理の途中で停止される場合があります。

2.9.3 hvenv.local での ELM の手動制御

ELM は手動で停止することができますが、これは上級ユーザまたはコンサルタントのみが行ってください。ELM は次のような場合に停止します。

● ローリングアップグレード

● テストまたはデバッグ

ELM を停止するには、HV_USE_ELM 変数を変更し、タイムアウトを適切な値に変更して起動します。

1. hvenv.localで HV_USE_ELM=0に設定します。

226 ページの “HV_USE_ELM” を参照してください。

2. hvcm -h <timeout> ... で RMS を起動します。

ELM 停止中の推奨タイムアウト時間は 45 秒です。hvcm のマニュアルページを参照してください。RMS の起動時にハートビートタイムアウトを Cluster Admin GUI から指定する方法はありません。

hvenv.local で HV_USE_ELM=1 に設定することもできます。ただし、CF がインストールされていない場合は、この設定が有効になると RMS は起動できなくなります。RMS は switchlog 内のメッセージでこのことを通知します。

J2UZ-5294-06Z0(03) 33

Page 42: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

RMS ハートビート RMS の詳細説明

34 J2UZ-5294-06Z0(03)

Page 43: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

3 スケーラブルコントローラ

本章では、スケーラブルコントローラとスケーラブルアプリケーションの操作の詳細について説明します。本章で説明する内容は以下のとおりです。

● 35 ページの “コントローラの概要 ” では、コントローラによるアプリケーションの制御について説明しています。

● 35 ページの “スケーラブルコントローラとアプリケーション ” では、スケーラブルコントローラで制御されるアプリケーションについて説明しています。また、スケーラブルコントローラの利点および属性についても説明しています。

● 37 ページの “Online/Offline 処理と状態遷移 ” では、制御されるアプリケーションの状態とコントローラの状態、およびその属性について説明しています。

3.1 コントローラの概要

コントローラを使用することにより、アプリケーションで別のアプリケーションの監視および制御ができます。コントローラサブアプリケーションを含むアプリケーションは「制御するアプリケーション」または「親アプリケーション」と呼ばれます。コントローラに定義されたアプリケーションは、「制御されるアプリケーション」または「子アプリケーション」と呼ばれます。子アプリケーションは、親アプリケーションに定義されたリソースのように動作します。「制御するアプリケーション」をマスタアプリケーション、「制御されるアプリケーション」をスレーブアプリケーションというように考えることもできます。

3.2 スケーラブルコントローラとアプリケーション

スケーラブルコントローラでは、複数のアプリケーションを集中的に管理、制御し、情報の表示ができます。スケーラブルコントローラで「制御されるアプリケーション」は、スケーラブルアプリケーションと呼ばれます。

たとえば、スケーラブルコントローラを含む「制御するアプリケーション」を Online に切替えると、スケーラブルアプリケーションはコントローラの ApplicationSequence 属性に定義された順序でOnlineに切り替わります。制御するアプリケーションを Offlineに切替えると、スケーラブルアプリケーションは逆の順序で Offline に切り替わります。同時に、スケーラブルコントローラの状態はスケーラブルアプリケーションの組み合わされた状態を反映し、この状態は GUI または hvdisp コマンドによって表示することができます。

スケーラブルコントローラとスケーラブルアプリケーションは、複数の構成リソースを複合的に制御および管理する必要のある場合に便利です。このような構成はこれまで、複数のフォロータイプのコントローラを使って実装されてきました。しかし、スケーラブルコントローラを使用すると、非常に複雑で可用性の高い構成を構築し、1 つの固まりとして扱うことが可能です。

3.2.1 スケーラブルアプリケーション

スケーラブルアプリケーションとは、スケーラブルコントローラで制御される任意のアプリケーションを意味します。さまざまなスケーラブルアプリケーションが、同一ノードまたは異なるノード上で同時に Onlineの状態になる可能性があります。たとえば、Oracle RAC、Fujitsu Symfoware および IBM DB2PE (Parallel Edition) などの並列データベースはすべて、個別のインスタンスをクラスタ内の異なるノードで同時に実行する可能性のあるデータベースサーバです。データベースインスタンスのそれぞれに個別のアプリケーションが構成されます。 上位のアプリケーションが、すべてのアプリケーション ( またはデータベースインスタンス ) の監視および制御を行います。 上位のアプリケーションは「制御するアプリケーション」と呼ばれます。「データベースインスタンス」のアプリケーションは、「制御されるアプリケーション」と呼ばれます。このようなコンポーネントを、スケーラブルコントローラで「制御されるスケーラブルアプリケーション」として構成することにより、このコントローラからクラスタ内のサーバ全体にアクセスすることが可能になります。たしかにこれは商用データ処理では もよく目にするスケーラブルアプリケーションです。ただし、同様の要件を持ついかなるアプリケーションでも同じように構成できます。

J2UZ-5294-06Z0(03) 35

Page 44: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

スケーラブルコントローラとアプリケーション スケーラブルコントローラ

3.2.2 スケーラブルコントローラによる利点

スケーラブルコントローラの主な利点は、親アプリケーションが動作するノードとは別のノードで子アプリケーションを実行できる ( または実行しなければならない ) 構成が可能な点です。さらに、並列データベースの場合など、アプリケーションが複数存在する場合の管理が簡単になります。

たとえば、Oracle RAC を構成する場合には、各ノードにそれぞれ別のユーザアプリケーションを使用させる方法があります。各ユーザアプリケーションはノードごとに独立して管理されます。Oracle RAC は共用アクセスデータベースであるため、クラスタ内で一部のインスタンスが動作していれば、データベース全体にアクセスできます。このためこの構成は Oracle RAC では問題なく動作します。

しかし、IBM DB2 PE などの非共用データベースでは、データベース全体のアクセスを可能にするにはデータベースのすべてのインスタンスを Online にする必要があります。従来のフォローコントローラを使用した場合、DB2 PE をサポートする構成は、複数のアプリケーションと依存関係が必要となります。スケーラブルコントローラを使用すれば、このような構成の構築はもっと単純になります。

複数のノードに跨る複数のアプリケーションや、アプリケーション間の依存関係をサポートするため、さまざまな構成オプションが用意されています。以下のセクションでは、スケーラブルコントローラについてより詳しく説明します。

3.2.3 スケーラブルコントローラの属性

Scalableというコントローラの属性は、スケーラブルな子アプリケーションを制御します。コントローラの Scalable属性が 1 に設定された場合、Resource属性で指定されたすべてのアプリケーションは、スケーラブルアプリケーションと見なされます。

ある子アプリケーションを制御できるのは、1 つのスケーラブルコントローラのみです。子アプリケーションが複数の親コントローラに関連付けられることはできません。あるアプリケーションが複数のスケーラブルコトローラを含む場合があります。アプリケーションがスケーラブルコントローラを複数もつことに制限はありません。ただし、使用するによっては、での構成時の選択肢が制約される場合があります。

次の図は、一般的なスケーラブルコントローラの属性を示す Cluster Admin View です。

図 5: スケーラブルコントローラの属性

36 J2UZ-5294-06Z0(03)

Page 45: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

スケーラブルコントローラ Online/Offline 処理と状態遷移

上の図に示すスケーラブルコントローラコントローラの属性の一部は、インタフェースで設定できます。これらの属性は、本例では次のように設定されています ( 図中の上から下 )。

● MonitorOnly=0

● Resource=< アプリケーションのリスト >

● ApplicationSequence=<Resource 属性に定義されたアプリケーションの起動順番 >

● ScriptTimeout=180

● FaultScript=< スクリプト定義 >

● StateChangeScript=< スクリプト定義 >

スケーラブル運用に影響する他の属性は、スケーラブルコントローラの構成時にによって自動設定されます。

切替え処理および状態遷移における一部の属性の影響については、以下のセクションで説明します。

3.3 Online/Offline 処理と状態遷移

3.3.1 制御されるアプリケーションの状態とコントローラの状態

表 1 に、「制御されるアプリケーション」の状態に応じたスケーラブルコントローラコントローラの状態を示します。

注意 : 異なるスケーラブルアプリケーションであれば、同一ノードまたは異なるノードで同時に 2 つ以上を Online にすることはできますが、個々のスケーラブルアプリケーションは、1 つのノードでしかOnlineにすることができません。たとえば、Oracle RAC の RMS 構成設定を行う場合、Oracle デーモンプロセスは、複数のノードで Onlineにする必要があるため、単一の RMS アプリケーションではなく、複数の独立した制御される RMS アプリケーション ( デーモンごとに 1 つの子アプリケーション ) として表す必要があります。これら子アプリケーションはすべて、Oracle RAC の親スケーラブルコントローラから集中的に制御、管理および表示することができます。

コントローラの状態 子アプリケーションの状態

Online 任意のノード上で 低 1 つが Online

Offline すべてのノード上ですべてが Offline

Faulted 任意のノード上で 低 1 つが Faulted、すべてのノード上で他のすべてが Offline

Standby 任意のノード上で 低 1 つが Standby、すべてのノード上で Onlineがない

Warning 任意のノード上で 低 1 つが Online、すべてのノード上で他は Offline

表 1: 子アプリケーションの状態とスケーラブルコントローラの状態の関係

J2UZ-5294-06Z0(03) 37

Page 46: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

Online/Offline 処理と状態遷移 スケーラブルコントローラ

3.3.2 制御されるアプリケーションへの要求の伝播

コントローラからの優先 Online 要求は、制御されるすべてのアプリケーションに伝播され、それらの各アプリケーションは PriorityList 属性に定義されたノードの順序に従って Online 状態に遷移します。Offline および Standby 要求はすべてのノード上で、すべての制御されるアプリケーションに伝播されます。

IndependentSwitch属性は、スケーラブルコントローラオブジェクトでは 1 に設定されなければなりません。この属性により、制御される子アプリケーションに影響を与えずに、親アプリケーションをノード間で切替えることができるようになります。ただし、親アプリケーションが「hvswitch -f」などの強制要求によって切替えられる場合は、IndependentSwitch 属性の設定は無視されます。この場合、コントローラによって切替え処理の一部としてOffline要求がそれぞれの子アプリケーションに伝播されます。

RMS の停止や OS のシャットダウンによって親アプリケーションと子アプリケーションが同時に切替わり、子アプリケーションが次に優先度の高いノード上で Online 状態になる前に RMS の再起動が完了した場合、子アプリケーションは、その PriorityList 属性に定義されたノードの順序に従って Online状態に遷移します。このため、子アプリケーションは、切替え前のノードで再び Online 状態となります。

3.3.3 コントローラの Warning 状態

スケーラブルコントローラが Warning 状態になる場合があります。ある Online 状態のコントローラに制御されるアプリケーションの少なくとも 1 つが Online 状態でない場合、そのコントローラにWarning 状態は通知されます。また、ある Standby 状態のコントローラに制御されるアプリケーションの少なくとも 1 つが Standby 状態でない場合、そのコントローラに Warning 状態は通知されます。この場合、コントローラの実際の状態は Online または Standby 状態ですが、GUI および hvdisp コマンドが Warning 状態を表示するために、コントローラが Warning 状態を通知します。この警告は、管理者に対してスケーラブルな親アプリケーションが完全な能力を発揮していないことを示しています。

スケーラブルコントローラが Warning状態を通知するのは、制御されるアプリケーションの機能が「低下した」場合に限られます。つまり、コントローラが Online 状態である場合に、少なくとも 1 つのアプリケーションが Online 状態から Offline、Standby または Faulted 状態に変わるときです。コントローラが、実際に Offline 状態または Faulted 状態である場合に、コントローラは Warning 状態を通知しません。代わりに、実際の Offline状態または Faulted 状態を通知します。

3.3.4 アプリケーションの Warning 状態

スケーラブルコントローラのうち少なくとも 1 つが Warning 状態になると、スケーラブルコントローラを含むアプリケーションは Warning 状態になります。すべてのスケーラブルコントローラが送信されたWarning以外の状態になると、アプリケーションはそれぞれの状態に戻ります。コントローラの場合と同様、GUI および hvdisp コマンドでは Warning 状態が表示され、管理者に対してスケーラブルな親アプリケーションの完全な機能が稼動していないことを警告します。

コントローラが Offline または Faulted に遷移するか、制御されるすべてのアプリケーションがOnlineまたは Standbyに遷移すると、Warning状態はそれぞれの状態に変わります。

3.3.5 コントローラ StateChangeScript

コントローラの StateChangeScript属性には、制御される子アプリケーションが Online、Offline、Faulted、または Standby 状態に遷移するたびにスケーラブルコントローラで実行されるスクリプトを指定します。スクリプトは、制御する親アプリケーションが動作できるすべてのノードで実行されます。これはコントローラ自身から出された要求に代わって実行される場合でも同じです。StateChangeScript スクリプトは、子アプリケーションが実行されているノードの状態が Offlineまたは Faultedに遷移した場合にも実行されます。このスクリプトは、状態遷移には影響しません。異常終了コードが switchlogに記録されるだけです。

38 J2UZ-5294-06Z0(03)

Page 47: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

スケーラブルコントローラ Online/Offline 処理と状態遷移

同時に複数の状態遷移イベントが送信された場合、それぞれのイベントに対して StateChangeScriptスクリプトが実行されます。イベントを受信すると、即座 ( 遅延なし ) に StateChangeScriptスクリプトがスケジューリングされます。同じノードから複数のイベントが送信された場合は、必ずイベントを受信した順序に従って StateChangeScriptが呼び出されます。

スクリプト実行時環境変数

StateChangeScript の実行時には、以下の RMS 環境変数が設定されています。各変数の名前と用途を以下に示します。各変数の内容およびフォーマットの詳細については、224 ページの “RMS グローバル環境変数 ” 、230 ページの “RMS スクリプト実行環境変数 ” を参照してください。

RMS では、状態変更スクリプトの呼び出しがアプリケーションの状態変化に起因するか、ノードの状態変化に起因するかに応じて、以下の 2 つの RMS 環境変数が使用できます。

● HV_APPLICATION_STATE_CHANGE_INFO

StateChangeScript スクリプトの呼び出しが、「制御されるアプリケーション」の状態変化に起因する場合に設定されます。コロンで区切られた各文字列は以下の意味を持ちます。

– ノード上のアプリケーションの前の状態 ( ローカルノードに記録された状態と同一 )

– ノード上のアプリケーションの現在の状態 ( ローカルノードに記録された状態と同一 )

– アプリケーションの状態が変化したノードの名前

– 状態が変化したアプリケーションの名前

StateChangeScriptスクリプトの呼び出しがノードの状態変化に起因する場合、HV_APPLICATION_STATE_CHANGE_INFOは空になります。

● HV_HOST_STATE_CHANGE_INFO

「制御される子アプリケーション」を実行可能な SysNodeの状態が Offlineまたは Faultedに変化したために、スケーラブルコントローラの StateChangeScriptスクリプトが呼び出された場合に設定されます。コロンで区切られた各文字列は以下の意味を持ちます。

– 前のノードの状態

– 現在のノードの状態

– ノードの名前

– ノードの状態変化の理由 : シャットダウン機構、hvshutコマンド、または不明。

StateChangeScriptスクリプトの呼び出しが「制御される子アプリケーション」の状態変化に起因する場合、HV_HOST_STATE_CHANGE_INFOは空になります。

RMS が呼び出す他のスクリプトと同様に、StateChangeScriptでも以下の RMS 環境変数を参照できます。

● HV_APPLICATION

現在のオブジェクトを含む現在のサブツリーの 上位にあるuserApplicationオブジェクトの名前です。

● HV_AUTORECOVER

1 が設定されている場合、スクリプトの呼び出しが AutoRecover の試行に起因することを示します。

● HV_FORCED_REQUEST

1 が設定されている場合、強制要求によるスクリプト呼び出しであることを示します。

● HV_LAST_DET_REPORT

現在のオブジェクトに対して、ディテクタが検知した 新の状態です。

● HV_OFFLINE_REASON

J2UZ-5294-06Z0(03) 39

Page 48: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

Online/Offline 処理と状態遷移 スケーラブルコントローラ

実行中の Offline処理の理由 : 保守停止要求、手動切替え、リソース故障後のフォローアップ処理、またはアプリケーション停止要求

● HV_NODENAME

現在のオブジェクトの名前です。

● HV_SCRIPT_TYPE

スクリプトの種類です。

● NODE_SCRIPTS_TIME_OUT

現在のオブジェクトおよびスクリプトの種類のタイムアウト値です。

スクリプト実行シーケンス

StateChangeScriptスクリプトは、イベントを受信すると即座に実行されます。その結果、他の RMSスクリプト ( 他のオブジェクトまたは現在のオブジェクトの StateChangeScriptスクリプトを含む )と並列に実行されることがあります。複数のイベントがほぼ同時に送信される可能性があるため、適切な順序で実行されるようユーザスクリプト側で調整する必要があります。スクリプトの作成者は、ロックまたは OS の他の機能を使用して、スクリプトから共有リソースへのアクセスが適切に行われるように配慮しなければなりません。

3.3.6 Online/Standby/Offline 処理の順序制御とアプリケーショングループ

コントローラの ApplicationSequence属性は、Online、Offline、および Standby要求がどのように子アプリケーションに伝播されるかを制御します。この属性では、コントローラの Resource属性で指定されるコントローラのすべての子アプリケーションのリストが示されますが、並列処理または順次処理であるかどうかでグループに分けられます。

スペースで区切られたアプリケーションのグループを、要求グループと呼びます。要求グループのアプリケーションはすべて並列処理されます。

コロン (:) で区切られた要求グループは、順次処理されます。Online または Standby 要求は、左から右へ順に処理されます。Offline要求は、右から左へ順に処理されます。

たとえば、コントローラの ApplicationSequence属性が以下のように指定されているとします。

A1 A2:B:C1 C2

コントローラによって、以下のように Online要求が発行されます。

1. A1 および A2 ( 初の要求グループ ) は並列処理され、一方が他方を待つことはありません。ただし、A1 および A2 の両方から Online状態が送信されない限り、コントローラは次のグループには進みません。

2. B (2 番目の要求グループ ) が次に処理されます。B から Online状態が送信されない限り、コントローラは次のグループには進みません。

3. C1 および C2 (3 番目の要求グループ ) が 後に並列処理されます。

Offline 要求は、これと逆の順番で処理されます。つまり、C1 および C2 が 初に処理され、次に B、後に A1 および A2 が処理されます。

処理順序が重要になるのは、スケーラブルコントローラからの要求が「制御されるアプリケーション」に伝播されている間のみです。手動切替えおよび自動切替えを含む他の理由でアプリケーションの状態が変化した場合、ApplicationSequence属性は無視されます。

Offline処理の順序は、「hvshut –l」などのローカルの hvshutでも維持されます。ただし、「hvshut–a」などのクラスタ規模の要求では、順序が無視されます。各ノードでは、アプリケーションの Offline処理が独立して行われます。

他のサブアプリケーションと同様に、「hvshut –L」および「hvshut –A」の処理時にはスケーラブルな要求グループは処理されません。

40 J2UZ-5294-06Z0(03)

Page 49: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

スケーラブルコントローラ Online/Offline 処理と状態遷移

スケーラブルコントローラからの要求の伝播は、子アプリケーションが実行される可能性のあるノードの状態からも影響を受けます。同じ要求グループのアプリケーションのノードが使用可能でない場合、その要求は伝播されません。該当するノードが使用可能になるまで遅延されるか、ScriptTimeout 属性に設定された時間が経過するまで遅延されます。

3.3.7 サブクラスタでの自動起動

一部のノードが停止している状態をサブクラスタと呼びます ( 以降「サブクラスタ」と記載 )。この場合でも、「制御するアプリケーション」が自動起動できるように設定することができます。これが必要とされるのは、「制御される子アプリケーション」が親コントローラの ApplicationSequence属性で定義される順序に従ってクラスタシステムの一部で Onlineになる場合があるためです。

たとえば、はじめにすべてのクラスタノードが停止している状態から一部のノードが起動し、他のノードは依然メンテナンス中であったとします。他のクラスタノードが現在 Offlineまたは Faultedであるかどうかにかかわらず、起動中のサブクラスタで実行されるべき「制御されるアプリケーション」は、スケーラブルコントローラの要求に従って Online に切り替わる必要があります。管理者が不在な場合もあるため、この場合「hvswitch -f」を使用するような設定は選択できません。クラスタ構成が自身で自動的に起動する必要があります。

上記の例は、userApplication オブジェクトの PartialCluster 属性により実現できます。1 に設定すると、アプリケーションは自らのプライマリノードを含む他のノードが Offline または Faultedであっても、現在オンラインであるノード内で Online要求の処理ができます。0 に設定すると、( 現在の動作では ) アプリケーションは実行が可能なすべてのノードが Onlineである場合にしか、Online要求の処理ができません。デフォルト値は 0 です。

スケーラブルコントローラを含むアプリケーション ( 制御するアプリケーション ) において、アプリケーショングラフに ClusterExclusive 属性が設定されたリソースがない場合 PartialCluster属性 を1 に設定できます。それ以外の場合は、PartialCluster属性 を 0 に設定する必要があります。

「制御するアプリケーション」に controller オブジェクト以外のオブジェクトが含まれない場合は、PartialCluster 属性を 1 に設定しても問題ありません。「制御するアプリケーション」が異なるサブクラスタで複数自動起動されても、排他リソースは共用されません。自動起動の一部として、それぞれの「制御されるアプリケーション」に Online 要求が伝播され、現在のサブクラスタからノードが要求された場合は、これらのアプリケーションが Onlineになることもあります。

しかし、一部の「制御されるアプリケーション」が複数のサブクラスタからノードを要求した場合、これらのアプリケーションは Onlineにはなりません ( これが本来の動作です )。これらのアプリケーションの PartialCluster 属性は 0 に設定されており、サブクラスタにまたがっている「制御されるアプリケーション」が Online処理を拒否するようになっています。

各アプリケーショングループの「制御されるアプリケーション」が Online になるまで、Online 要求の伝播がスケーラブルコントローラによって遅延するため、複数のノードが同じスケーラブルコントローラに対する Online要求を同時に開始した場合でも、ApplicationSequence属性で指定された順序は維持されます。

3.3.8 サブクラスタでの切替え

「制御するアプリケーション」の PartialCluster属性が設定されている場合、サブクラスタのノード間で自動または手動 (「-f」強制オプションの有無による ) で Onlineに切替えできます。これは、「制御するアプリケーション」自身については安全です。コントローラ以外には実際のリソースがないからです。また、「制御されるアプリケーション」についても安全です。それぞれの PartialCluster属性が 0 に設定されており、サブクラスタの境界をまたがった場合は Onlineにならないからです。

J2UZ-5294-06Z0(03) 41

Page 50: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

Online/Offline 処理と状態遷移 スケーラブルコントローラ

3.3.9 子アプリケーションの手動切替え

「hvutil -f」コマンドを使用して、Online状態の 後の子アプリケーションを手動で Offlineにしようとすると、親コントローラが Faulted 状態になります。このような状況を回避するため、RMS では Online状態にある 後の「制御されるアプリケーション」を Offlineにする「hvutil -f」コマンドが拒否され、以下のメッセージが生成されます。

ERROR: Application controlled from another online application - <application>.

3.3.10 保守モード時の操作

以下の例では、保守モード時のコントローラの動作について説明します。

● ノード shasta1および shasta2上にアプリケーション app1、app2、および app3が構成されているとします。

● app2は Followモードコントローラで app1を制御します。

● app3は Scalableモードコントローラで app2を制御します。

図 6 は、この例の RMS 構成ツリーおよび対応グラフを示しています。

図 6: 保守モード時のコントローラの例

3.3.10.1 ノード間でのアプリケーションの切替え

グラフの観点から、これらを「横方向」の切替え操作として考えることができます。

スケーラブルコントローラに制御された子アプリケーションが保守モードに切替えられた場合、その親はhvswitchコマンドを使用してノード間で手動または自動で切替えることができます (図 7)。app2を保守モードに切替えると、フォローコントローラに制御された子アプリケーションである app1 も自動で保守モードに切り替わります。

スケーラブルコントローラ

フォローコントローラ

42 J2UZ-5294-06Z0(03)

Page 51: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

スケーラブルコントローラ Online/Offline 処理と状態遷移

図 7: 子が保守モードの場合にスケーラブルな親アプリケーションを切替える

同様に、スケーラブルコントローラの親アプリケーションが保守モードに切替えられた場合、その子はhvswitchコマンドを使用してノード間で切替えることができます ( 図 8)。ただし、保守モードでは親は処理要求を発行しないため、実際は手動コマンドによってのみ実行できます。app2を異なるノードに切替えると、フォローコントローラに制御された子アプリケーションである app1 も自動的にそのノードに切り替わります。

図 8: 親が保守モードの場合にスケーラブルな子アプリケーションを切替える

つまり、これらの「水平」の hvswitchコマンドは正しく処理されます。

J2UZ-5294-06Z0(03) 43

Page 52: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

Online/Offline 処理と状態遷移 スケーラブルコントローラ

3.3.10.2 Online、Offline、および Fault 処理の制約

グラフの観点から、これらを「縦方向」の切替え操作として考えることができます。

app2が保守モードのときに app3を hvutilコマンドで Offlineにすることを考えます ( 図 9)。

図 9: 子が保守モードの場合に親を Offline にするよう試行する

前述の hvswitchコマンドと異なり、この「hvutil -f」操作では、処理の続行に子アプリケーションからの応答を必要とします。保守モードで app2 が親からの通常の処理要求に応答できないため、Offline 要求は 終的にタイムアウトになります。「hvutil -c」で Fault 処理を試行する場合も同じです。

親が保守モードの場合に子を Offlineにするよう試行しても ( 図 10)、やはり失敗しますが、前の場合のような長い遅延がありません。Offline 処理を開始できるのは親だけであるため、RMS がすぐにエラーを生成します。

図 10: 親が保守モードの場合に子を Offline にするよう試行する

親からの応答を必要としないため、Fault処理の「hvutil -c」要求を子に対して発行できます。

つまり、これらの「縦方向」の hvutil コマンド操作は、保守モードの子または親アプリケーションからの応答がアプリケーションで必要とされる場合に失敗します。

44 J2UZ-5294-06Z0(03)

Page 53: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

スケーラブルコントローラ Online/Offline 処理と状態遷移

3.3.10.3 スケーラブルコントローラで推奨される操作

保守モードの要求は制御階層の 上位アプリケーションに対して発行することを強く推奨します。これは、予期しない動作を回避するのに役立ちます。

● 子アプリケーションは他のノードへ切替えるための自動要求を親から受信しません。また、自動の Online、Offline、または Fault処理要求が親から伝播されることはありません。

● リソース故障の場合、下位レベルオブジェクトからの切替え要求はすぐに失敗します。RMS はタイムアウト遅延を待機せずに Fault処理を開始できます。

J2UZ-5294-06Z0(03) 45

Page 54: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

Online/Offline 処理と状態遷移 スケーラブルコントローラ

46 J2UZ-5294-06Z0(03)

Page 55: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

4 トラブルシューティング

本章では、コマンドラインインタフェース (CLI) および Cluster Admin グラフィカルユーザインタフェース (GUI) で RMS のトラブル発生時に原因を特定する方法と対処について説明します。ここでは、ログファイル、ログファイルの格納場所、ログレベルをオンにする方法、GUI でログを表示する方法、CLIでログを表示する方法について詳しく説明します。

本章で説明する内容は以下のとおりです。

● 47 ページの "4.1 概要 " では、トラブルシューティングプロセスの概要を説明します。

● 48 ページの "4.2 デバッグメッセージとエラーメッセージ " では、RMS のデバッグメッセージとエラーメッセージについて説明します。

● 49 ページの "4.3 ログファイル " では、RMS ログファイルを示し、その内容について説明します。

● 50 ページの "4.4 RMS BM ( ベースモニタ ) ログ出力の管理 " では、RMS BM ( ベースモニタ ) とそのコンポーネントによって生成されたログの管理方法を説明します。

● 52 ページの "4.5 アプリケーションログの出力の管理 " では、PCS または RMS Wizard Tools アプリケーションおよびリソースコンポーネントによって生成されたログの管理方法を説明します。

● 52 ページの "4.6 ディテクタログの出力の管理 " では、標準の PCS または RMS Wizard Tools リソースディテクタによって生成されたログの管理方法を説明します。

● 56 ページの "4.7 RMS ログメッセージの意味 " では、標準の PCS または RMS Wizard Tools リソースディテクタによって生成されたログの管理方法を説明します。

● 58 ページの "4.8 RMS ログメッセージの表示 " では、ログビューア機能について説明します。

● 66 ページの "4.9 RMS ログファイルのクリーンアップ " では、RMS ログファイル大きさの自動管理および手動管理について説明します。

● 68 ページの "4.10 構成のトラブルシューティング " では、PCS および RMS Wizard Tools で使用できるトラブルシューティングの資料や方法について説明します。

● 73 ページの "4.11 RMS トラブルシューティング " では、RMS の使用中に発生する問題の解決方法を示します。

● 76 ページの "4.12 高度なトラブルシューティングのための情報収集 " では、高度なトラブルシューティングのための情報収集” では、コンサルタントや開発者向けのダンプコマンドについて説明します。

4.1 概要

Cluster Admin の以下のいずれかで、エラー状況または状態変更を検出した場合、RMS トラブルシューティングを開始します。

● クラスタテーブル

● RMS ツリー

● グラフ

クラスタテーブルには要約情報が入っています。エラーの状態を調査するには、このテーブルから始めると便利です。詳細情報については、RMS ツリーまたはグラフを参照します。switchlogやアプリケーションログの調査は、ログビューア機能を使用してログファイルを表示することができます。

ログビューアには、以下の基準に基づく検索機能があります。

● キーワード

● 重要度

● 0以外の終了コード

J2UZ-5294-06Z0(03) 47

Page 56: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

デバッグメッセージとエラーメッセージ トラブルシューティング

キーワードと日付範囲フィールドを使用して、エラーの原因を検索します。緊急な問題、警告、および重大な状態を重要度に基づいて検索することができます。問題を未然に防ぐトラブルシューティングを行う場合、重要度コード (error、warning、notice、info) に基づいて検索することができます。

定期的にログビューアを使用し、重要度レベルに基づいてログファイルを調べることによって、重大な問題が発生するのを回避することを推奨します。問題の原因を診断できない場合は、クラスタ内の複数のノードからログビューアを調べてください。

対処法については、73 ページの "4.11 RMS トラブルシューティング " を参照してください。

以下の手順に従ってエラーを解決します。

1. Cluster Admin GUI を使用します。

2. 必要な場合は、ログファイルを表示します。

3. ログレベルを変更して詳細情報を取得します。

4. GUI でエラーを解決できない場合は、コマンドラインインタフェースを使用します。標準のUNIX コマンドを使用します。

5. 問題が続く場合は、RMS 以外の問題かどうかを確認し、適切なマニュアルを参照します。

6. オペレーティングシステム、ハードウェア、ネットワークエラーのようなシステム関連の問題を調べます。

7. 自分で問題を解決できない場合は、当社技術員 (SE) に連絡してください。

4.2 デバッグメッセージとエラーメッセージ

RMS のコンポーネント (BM ( ベースモニタ ) やディテクタなど ) が動作しているときは、デバッグメッセージとエラーメッセージがログファイルに書込まれます。RMS のデフォルト設定では、これらのファイルが /var/opt/SMAWRrms/log ディレクトリに格納されます。hvenv.localファイルで設定されている RELIANT_LOG_PATH環境変数で、このディレクトリを変更できます。

RMS を起動すると、ログへの書込みを開始します。デフォルト設定では、BM はすべてのエラーメッセージをログファイルまたは stderr に書込みを行います。デフォルト設定ではデバッグ出力が詳細に制御されているため、通常はデフォルト設定を変更する必要はありません。

必要な場合は、BM で任意のノードの状態とメッセージをすべて記録することができます。しかし、ほとんどの場合、デバッグ出力を理解するには、RMS 内部の操作に関する詳しい知識が必要です。このような情報は、当社技術員でなければ正しく評価できません。

RMS クラスタの管理者は、通常、switchlogファイルを調べるだけで十分です。このファイルには、着信切替要求やノードまたはリソースで発生する障害など、RMS の重要なアクションがすべて記録されます。

RMS 構成に固有のログファイルもログディレクトリに格納されます。管理者は必要に応じてこれらのファイルを調べる必要があります。各ログファイルの名前 (<userApplication>.log) は、RMS WizardTools で設定した RMS 構成によって異なります。詳細については、52 ページの "4.5 アプリケーションログの出力の管理 " を参照してください。

bmlogログファイルも、問題の解決に使用できます。

48 J2UZ-5294-06Z0(03)

Page 57: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

トラブルシューティング ログファイル

4.3 ログファイル

表 2 は、/var/opt/SMAWRrms/logに格納されている RMS ログファイルについて説明しています。

モジュール ファイル名 内容

BM tracelog オブジェクト間で送信されるすべてのメッセージ、およびすべての変更指示が記録されます。デフォルトでは、RMS はtracelogにメッセージを出力しません。

BM abortstartlog 起動中に、以下のメッセージが出ると、このファイルが作成されます。FATAL ERROR: RMS has failed tostart!詳細情報がさらに switchlog に記録される場合もあります。このファイルは、当社技術員 (SE) が RMS起動失敗の原因を判別するために作成されます。

BM bmlog 通常、一般的な RMS エラーログ情報とメッセージログ情報は、メッセージ報告から詳細な情報まで、レベルによって分類されます。BM の起動時に指定するエラーログレベルによって、このファイルの内容が決まります。詳細については、68 ページの "4.10 構成のトラブルシューティング " を参照してください。

実行時に BM が受信したすべてのメッセージが記録されています。

hvdump によって生成された情報も含んでいます (76 ページの "4.12.1 hvdump コマンドの使用 (RMS)" を参照してください )。

ログレベルフラグをオンにすると、大量のディスクスペースを消費するため、このファイルの使用は管理者に限られています。デフォルトで、メッセージはbmlogに記録されません。

すべて (BM、汎用ディテクタ、ノードディテクタ )

switchlog 監視資源の切替えや異常に関する操作イベントが記録されます。通常、ユーザは本ファイルを使用して調査してください。

汎用ディテクタ <program>log ディテクタが受け取ったすべてのメッセージとジョブ指示が記録されます。また、対象資源の状態変化の情報とすべてのエラーメッセージも含まれています。program は RELIANT_PATH の下にあるディテクタの名前です。

表 2: ログファイル

J2UZ-5294-06Z0(03) 49

Page 58: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

RMS BM ( ベースモニタ ) ログ出力の管理 トラブルシューティング

4.4 RMS BM ( ベースモニタ ) ログ出力の管理

RMS BM ( ベースモニタ ) は実行時に、RELIANT_LOG_PATH/switchlog ファイルとシステムログファイルに、ログメッセージを出力することができます。このセクションでは、ログファイルのログレベル ( 詳細情報の程度 ) を制御する方法について説明します。各ログレベルとも、上級ユーザのための内部機能に関する情報が記録されます。

複数のログレベルを有効にして RMS を実行すると、システムのパフォーマンスに影響します。この機能は、テストまたはデバッグ目的でのみ使用してください。

4.4.1 RMS BM ( ベースモニタ ) ログレベルの管理

デフォルトでは、ベースモニタログ機能は RMS 起動時に停止しています。ログレベルの初期値は、hvcmの -lオプションで指定することができます。

hvcm -l <level> -c <configuration_file> ...

RMS がすでに実行中の場合は、以下のコマンドでベースモニタのログレベルを管理します。

hvutil -l display

hvutil -l off

hvutil -l <level>

初の hvutil コマンドで、ベースモニタの現在のログレベルを表示し、2 番目の hvutil コマンドでベースモニタのログ機能を停止します。

hvcm または hvutil で -l <level> を指定すると、ベースモニタのログ機能が起動されます。<level> には、以下の形式で数値を 1 つ以上指定します。

● 数字 1 つ

● カンマ区切りまたは空白区切りのリスト。空白区切りのリストの場合は、引用符で囲む。例 : 2,4,5,7 "2 4 5 7"

● n1-n2 のようにハイフンで区切った範囲指定。こうすると、n1 から n2 までのログレベルがすべて含まれます。-n2 と指定した場合は 1-n2 と同じ、n1-は n1 を超えるすべてのログレベルを表します。n1 の値は 1 以上であることが必要です。例 : 2-7 -7 2-

ログレベルを 0 ( ゼロ ) に指定するとすべてのログレベルが有効になります。ログ機能を停止するには offという特別なレベルを指定する必要があります。

現在のログレベルは次回 hvutil -l <level> または hvutil -l offが実行されるか、RMS が停止されるまで有効です。

50 J2UZ-5294-06Z0(03)

Page 59: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

トラブルシューティング RMS BM ( ベースモニタ ) ログ出力の管理

表 3 はベースモニタに指定できるレベルの一覧です。

4.4.2 システムログへの BM ( ベースモニタ ) 出力の制御

デフォルトでは、RMS ベースモニタは、switchlog ファイルとシステムログファイルに同一の内容を出力します。この設定は、HV_SYSLOG_USE環境変数で制御します。

デフォルトでは HV_SYSLOG_USE = 1に設定されています。この設定は、システムログと switchlogに、RMS の NOTICEメッセージ、WARNINGメッセージ、ERRORメッセージ、および FATAL ERRORメッセージをすべて出力します。

RMS メッセージをシステムログに出力しないようにするには、hvenv.localファイルでHV_SYSLOG_USE=0に設定します。変更を有効にするには、RMS を再起動する必要があります。

注意:Log3 RMS メッセージの場合、コンポーネント番号は 1080023 です

ログレベル 意味

0 すべてのログレベルをオンにします

1 未使用

2 ディテクタ履歴をオンにします

3 hvdispレベル

4 mskx履歴 (BM のスタック履歴 ) をオンにします

5 エラーメッセージまたは注意メッセージ

6 ハートビートと通信デーモンのレベル

7 BM レベル

8 汎用コントローラメッセージ

9 管理コマンドメッセージ

10 基本タイプレベル

11 動的再構成コントラクトレベル

12 シャットダウンデバッグレベル

13 トークンレベル

14 ディテクタメッセージ

15 ローカルキューレベル

16 ローカルキューレベル

17 スクリプトレベル

18 userApplicationコントラクトレベル

19 一時的なデバッグ履歴

20 SysNode履歴

21 メッセージレベル

22 bm トレースログ

23 SatNodeトレースログ

表 3: BM ( ベースモニタ ) のログレベル

J2UZ-5294-06Z0(03) 51

Page 60: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

アプリケーションログの出力の管理 トラブルシューティング

4.5 アプリケーションログの出力の管理

RMS 構成ツール (PCS および RMS Wizard Tools) で提供される実行時コンポーネントは、RMS ベースモニタと同じログディレクトリ内のファイルにログメッセージを記録します。このディレクトリは、RELIANT_LOG_PATH 環境変数で定義されています。これらのコンポーネントが出力するメッセージは大きく 2 つに分類できます。

● リソースディテクタからのメッセージ

● その他のメッセージ

ディテクタのログ機能は 52 ページの "4.6 ディテクタログの出力の管理 " で説明されています。以下の記述はその他のメッセージについての説明です。

構成ツールで提供される実行時コンポーネントは、アプリケーションレベルのすべてのログを記録します。通常のユーザ向けのメッセージに加え、さまざまなレベルのデバッグメッセージも生成します。ユーザ向けメッセージおよびデバッグメッセージはRELIANT_LOG_PATHの以下のファイルに出力されます。

● switchlog — PCS および RMS Wizard Tools で提供される標準のサブアプリケーションは、障害や Offline 遷移関連のディテクタレポートを switchlogファイルに記録します。

● <application_name>.log — アプリケーション固有のログファイルには、そのアプリケーションに関連するすべてのメッセージが記録されます。アプリケーションが実行するすべてのスクリプトの出力もログファイルに書き込まれます。ファイルは、アプリケーションに対する Offline 処理または Online 処理が開始された時点で作成されます。

● hvdet_<xxx>.g<n>logおよび pcsdet_<xxx>.g<n>log — ディテクタが監視するリソース関連の情報 ( すべての状態変化など ) がすべて記録されるディテクタログファイルです。

アプリケーションの問題をデバッグするときは、switchlog ファイル、アプリケーション固有のログファイル、および対応するディテクタログファイルの内容をすべて調べる必要があります。

4.5.1 標準スクリプトのデバッグメッセージの制御

標準の PCS および RMS Wizard Tools スクリプトのデバッグ出力は、hvenv.localファイルの環境変数HV_SCRIPTS_DEBUGの設定により制御することができます。

● デバッグ出力を開始するには次のエントリを作成します。

export HV_SCRIPTS_DEBUG=1

● デバッグ出力を停止するには、HV_SCRIPTS_DEBUG エントリを削除するか、コメントアウトするか、値を 0 に設定します。

4.6 ディテクタログの出力の管理

すべての RMS ディテクタのインスタンスは、switchlog ファイルと、そのインスタンス専用のログファイルに情報を記録します。ログファイルは以下の形式で命名されています。

RELIANT_LOG_PATH/<detector_name>.g<n>log

<detector_name> はディテクタの名前、<n> はディテクタのインスタンス番号です。このようなファイルがディテクタの実行中のインスタンスそれぞれに 1 つ用意されています。なお PCS ディテクタの名前はpcsdet_<xxx>、RMS Wizard Tools ディテクタの名前は hvdet_<xxx> です。<xxx> はリソースのタイプを表します。

たとえば、 初の ( かつ唯一の ) pcsdet_system ディテクタのログファイルは<RELIANT_LOG_PATH>/pcsdet_system.g1logです。

すべてのリソース状態変化が、switchlogファイルとディテクタの専用ログファイルの両方に記録されます。他のディテクタメッセージはすべて専用ログファイルにのみ記録されます。

52 J2UZ-5294-06Z0(03)

Page 61: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

トラブルシューティング ディテクタログの出力の管理

4.6.1 デバッグメッセージとログレベル

各ディテクタインスタンスは、デバッグメッセージを保存しておくために、10KB のメモリバッファを内部に持っています。この内容は、デバッグイベント ( 予期せぬリソース状態の報告 ) が発生した場合に専用のログファイルに書き込まれます。このバッファは循環バッファです。つまり、新しいメッセージの発生により、バッファのオーバーフローが発生しそうになると、保存されているメッセージの も古いものから 1 つまたはそれ以上が上書きされます。この処理はデバッグイベントによってバッファ全体がログファイルに書き出されるまで続き、書き出された時点でバッファはリセットされます。このため、もっとも新しいメッセージのみがログに記録されます。古いデータは、デバッグイベントが発生した時点によっては失われている場合があります。

バッファの内容がログファイルに書き出される場合、メッセージは時系列に沿って書き込まれます。注意すべきことは、バッファ内の 新のメッセージはそのデバッグイベントによって生成されたものですが、バッファ内のそれ以前のメッセージは必ずしも関連したメッセージであるとは限らないという点です。ディテクタのログを参照すると、一連の開始メッセージに続いて、デバッグイベントメッセージが現れ、次にまた別の開始メッセージ、それに続いて別のデバッグイベントメッセージ、という形で記録されていることが分かります。このため、ディテクタのデバッグメッセージのすべてについて、検討中の問題と関連しているかどうかを、タイムスタンプと内容を見て確認する必要があります。

ディテクタが生成するメッセージにはすべて詳細レベルが割り当てられており、このレベルが高いとより多くのデバッグ情報が出力されます。実行時には、ディテクタの現在のログレベルと同じかそれより低いレベルのメッセージのみが内部のバッファに保存されます。各ディテクタのログレベルの初期値は1 に設定されています。

あるログレベルで生成される情報の量は、ディテクタのリソースタイプで決まります。高いログレベルが指定されたあるディテクタよりも、低いレベルが指定された別のディテクタのほうが、出力が多い場合もあります。

4.6.2 ディテクタのログレベルの設定

各リソースディテクタにつき個別のログレベルを、コマンド行、PCS、および RMS Wizard Tools で設定することができます。

ディテクタのログを開始するには、各ディテクタのログレベルの設定に関係なく、RMS ベースモニタのログレベルにレベル 2 ( ディテクタ履歴 ) が含まれている必要があります。デフォルトでは、ベースモニタのログレベルは offに設定され、ディテクタのログは停止されています。50 ページの "4.4 RMS BM ( ベースモニタ ) ログ出力の管理 " を参照してください。

4.6.2.1 hvutil -L によるディテクタのログレベルの設定

RMS がすでに実行中の場合は、以下のコマンドでディテクタのログレベルを管理します。

hvutil -L display <resource>

hvutil -L <level> <resource>

初の hvutil コマンドで、指定されたリソースの現在のディテクタログレベルを表示し、2 番目のコマンドでログレベルを設定します。

● <level> を 0 ( ゼロ ) に設定するとリソースのログ採取が停止し、正の数に設定するとそのレベルでログが採取されます。

● <resource> にはディテクタで監視するリソースの名前を指定します。これは汎用リソースであることが必要です。つまり、タイプが gResourceであるオブジェクトです。これらのリソースはhvdisp -aで表示することができます。

J2UZ-5294-06Z0(03) 53

Page 62: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

ディテクタログの出力の管理 トラブルシューティング

指定されたログレベルとリソースで実際に生成されるメッセージは、ディテクタが PCS によって提供されたものであるか、RMS Wizard Tools によって提供されたものであるかによって異なります。

現在のログレベルは次回 hvutil -Lによってログレベルが変更されるか、または hvutil -l offが発行されるか、RMS が停止されるまで有効です。

4.6.2.2 PCS によるディテクタのログレベルの設定

PCS ディテクタには、ログレベル 1 から 4 が指定できます。デフォルト値は 1 です。いずれのディテクタについても、ログレベルは PCS GUI から変更できます。

1. [Option] メニューから [Expert Mode] を選択してエキスパートモードに入ります。

2. 左側の構成ツリーで任意の場所をクリックして、[Edit] メニューから [Detector Settings] を選択します。[Detector Settings] 画面が表示されます ( 図 11)。

図 11: PCS ディテクタの詳細メニュー

3. 変更するディテクタのラジオボタンをクリックすると、右側のパネルに現在の設定が表示された画面に変わります。たとえば、pcsdet_system の設定は図 6 のようになります。

図 12: pcsdet_system の PCS ディテクタ詳細メニュー

4. [MemoryLogLevel] ドロップダウンリストを使用して目標の値に変更します。ここで指定したログレベルは選択したディテクタのみに適用されます。

5. < Back >ボタンをクリックして設定を保存し、[Detector Settings] 画面に戻ります。この画面で行った変更は取り消すことができません。

6. [Detector Settings] 画面で< Back >ボタンをクリックすると前の画面に戻ります。

54 J2UZ-5294-06Z0(03)

Page 63: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

トラブルシューティング ディテクタログの出力の管理

PCS GUI から設定されたディテクタのログレベルは、構成全体に適用されます。設定は、構

成が活性化され、RMS が再起動された後で有効になります。PCS GUI は実行時の動的なログ

レベルの変更は行いません。

pcsloglev コマンドによる実行時の調整

pcsloglev を使用することにより、すべての PCS ディテクタのログレベルを実行時に一時的に調整することができます。

pcsloglev [-a] level

level には 0 から 4 が指定できます。0 を指定するとすべてのディテクタのログ設定が構成設定時の設定に戻されます。レベルが何も指定されないと、現在の設定が表示されます。デフォルトでは、pcsloglevはディテクタのログレベルをローカルノードのみを対象にして設定します。クラスタ内のすべてのノードに設定を適用するには、-aを使用します。

pcsloglev の設定は構成の活性化、RMS の再起動、およびノードの再起動があっても維持されます。デバッグ作業の 後に必ず pcsloglev [-a] 0コマンドを実行して、すべてのディテクタログレベルを構成設定時のデフォルト値に戻してください。pcsloglevが1 より大きい値に設定されていると、RELIANT_LOG_PATH ファイルシステムがオーバーフローして、システム停止の結果を招きます。

4.6.2.3 RMS Wizard Tools によるログレベルの設定

指定できるログレベルは 1 から 9 です。デフォルト値は 1 です。ログレベルは以下のように hvwコマンドで変更することができます。

1. [Configuration-Edit-Global-Settings] メニューを選択します

2. [DetectorDetails] サブメニューを選択します。図 13 の画面が表示されます。

図 13: RMS Wizard Tools のディテクタ詳細メニュー

3. [MemoryLogLevel] を選択して値を希望するレベルに変更します。ログレベルはすべてのディテクタに適用されます

RMS 稼動中のログレベル変更

hvwコマンドを使用して、RMS Wizard ディテクタのデバッグレポート機能を動的にオンまたはオフに切替えることができます。

1. [Configuration-Edit-Global-Settings] を選択します。

2. [DetectorDetails] サブメニューを選択します。

3. [DynamicDetectorLogging] メニュー項目を選択します。

J2UZ-5294-06Z0(03) 55

Page 64: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

RMS ログメッセージの意味 トラブルシューティング

デフォルト値は 0 ( デバッグ機能はオフ ) です。1 から 9 の範囲の値を指定するとデバッグ機能がオンになり、数字が大きいほど情報が詳細になります。生成されるログメッセージの大きさは、ディテクタによって異なります。したがって、あるディテクタに大きな値を指定した場合でも、それより小さな値を他のディテクタに指定した場合より生成されるメッセージの数が少ないこともあります。値の変更は、次回構成が活性化されるまで有効になりません。

動的ログ機能を開始するため hvw を実行すると、実際には <RELIANT_PATH>/etc/wizardloglevel というファイルが作成されます。このファイルは、指定したログレベルを ASCIIの数値で記録したファイルです。hvwコマンドを使用せずに、直接 wizardloglevelファイルを手動で作成 (削除 ) することもできます。その場合は以下のルールに従ってください。

● ファイルが存在しない場合、または、ファイルに 0 ( ゼロ ) が記載されている場合は、デバッグはオフにされます。

● ファイルが存在しても内容が空の場合は、3 が指定されたものと見なされます。

● ファイルに 1 から 9 の数値が記載されている場合は、デバッグがオンになります。

デバッグ機能を有効にするのは、問題が発生した場合に限定してください。問題が解決したらデバッグ機能は必ずオフにして、ファイルシステムに無用な情報が蓄積されるのを防いでください。

4.7 RMS ログメッセージの意味

このセクションでは RMS のさまざまなコンポーネントが生成するメッセージの形式について説明します。

4.7.1 switchlog メッセージの形式

RELIANT_LOG_PATH/switchlogファイルにはユーザに関係する RMSイベント (切替要求や障害の指摘など ) が記録されます。次の 5 つの種類があります。

1. 情報メッセージ ( 通知 )

2. 警告メッセージ

3. エラーメッセージ

4. 致命的エラーメッセージ

5. RMS が実行したスクリプトの出力

通知、警告、エラー、致命的エラー

初の 4 つのカテゴリに属するメッセージは、次の形式をとります。

timestamp: (err_code, err_number): msg_type: msg_text: msg_end

メッセージの各フィールドは、後ろにスペースのついたコロン (: ) で区切られています。各フィールドは以下のとおりです。

1. timestamp は次の形式です。

yyyy-mm-dd hh:mm:ss.xxx

2. (err_code、err_number) は、そのメッセージを生成した内部コンポーネントを表す 2 文字または 3文字のコードに続けて、そのコンポーネントに関する一意のメッセージ番号が記されています。

56 J2UZ-5294-06Z0(03)

Page 65: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

トラブルシューティング RMS ログメッセージの意味

3. msg_type は、以下のいずれかです。

– NOTICE

– WARNING

– ERROR

– FATAL ERROR

4. msg_text は RMS 製品が生成するテキストです。1 行以上の文字列で構成され、各行の終わりには改行文字が付けられます。

5. msg_end は等号を 4 つ並べたもので (====) 後に改行文字が付けられます。先行する msg_text の後にも改行文字が付き、その後ろには区切り記号としてコロンとスペースがあるため、msg_end

は、ログファイルでは、独立した 1 行にコロン、スペース、および 4 つの等号が並んでいるように見えます (: ====) 。これにより、行数に関係なく、各メッセージの末尾が簡単に識別できます。

RMS ERRORおよび RMS FATAL ERRORメッセージの一覧 ( 先頭の timestamp および msg_end フィールドは省略 ) は、77 ページの "5 付録 — 致命的でないエラーメッセージ " および 143 ページの "6 付録 — 致命的エラーメッセージ " を参照してください。

スクリプトの出力

メッセージの 5 番目カテゴリであるスクリプトには、定まった形式はありません。これらのメッセージは、RMS 構成で定義されたスクリプトによって生成された標準出力および標準エラーストリームのリダイレクト出力です。先頭の timestamp フィールドおよび末尾の msg_end フィールドは通常ありません。

以下に短いスクリプトメッセージの例を示します。

Starting Reliant Monitor Services nowloadcount: 0loadcount lt 3

4.7.2 アプリケーションログメッセージの形式

PCS または RMS Wizard Tools 製品によって構成されたアプリケーションおよびリソースは、以下の形式のメッセージを出力します。

resource_ name: state: timestamp: msg_type: msg_text: msg_end

メッセージの各フィールドは、後ろにスペースのついたコロン (: ) で区切られていす。各フィールドは以下のとおりです。

1. resource_name は、スクリプトを実行しているリソースノードの名前です。メッセージと関連するリソースがない場合、このフィールドは空です。

2. state は、実行しているアクションのタイプを示します。このフィールドには、RMS によって環境変数 HV_SCRIPT_TYPEの値が設定されます。値は通常、onlineまたは offlineです。値は RMS 構成ツールによっても設定されます。PreCheck スクリプトを実行しているとき PreCheck になります。DEBUGタイプのメッセージでは、このフィールドが空になります。

3. timestamp は、メッセージが生成された日付と時刻です。フィールドの形式は yyyy:mm:dd hh:mm:ss です。yyyy は 4 桁の西暦、mm は月、dd は日、hh は [0-23] の範囲の時、mm は分、ss 秒を表します。

4. msg_type は、以下のいずれかです。

– DEBUG

– NOTICE

– WARNING

– ERROR

– FATAL ERROR

J2UZ-5294-06Z0(03) 57

Page 66: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

RMS ログメッセージの表示 トラブルシューティング

5. msg_text は RMS Wizard 製品が生成するテキストです。このテキストは複数行で構成されることがあるため、途中に改行文字が含まれる場合があります。通常このフィールドは改行文字では終了しません。

6. msg_end は等号を 4 つ並べたものです (====)。msg_text が改行文字で終わらないため、msg_end は同じ行に表示されます。

4.7.3 プログラムログメッセージの形式

RMS は、全体で高可用性管理を実現する多数の独立したプログラムから成り立っています。これらのプログラムはそれぞれ、専用のログファイルにトレースメッセージやエラーメッセージを出力します。ログファイルは以下の場所に格納されています。

RELIANT_LOG_PATH/<program_name>log

たとえば、RMS ベースモニタのプログラム名は bm であるため、専用ログファイルはRELIANT_LOG_PATH/bmlogが使用されます。

プログラムのトレースメッセージやエラーメッセージは内部のトラブルシューティング専用です。ここでは、PRIMECLUSTER のコンサルタントに情報提供を求められた場合に備え、メッセージの形式を説明します。

トレースメッセージには、以下のプリフィックスが付けられています。

timestamp: file: line:

エラーメッセージには、以下のプリフィックスが付けられています。

timestamp: file: line: ERROR

以下に簡単なトレースメッセージの例を示します。

2005-12-17 14:42:46.256: det_generic.C: 756: Return from GdCheck2005-12-17 14:42:46.256: det_generic.C: 773: Call to GdGetAttribute2005-12-17 14:42:46.257: det_generic.C: 775: Return from GdGetAttribute2005-12-17 14:42:46.257: det_generic.C: 790: reporting state to bm

4.8 RMS ログメッセージの表示

Cluster Admin インタフェースが持つログ表示機能により、任意のノードで、RMS の switchlog およびアプリケーションのログに含まれるエントリを表示し、フィルタリングすることができます。

すべての RMS ログファイル ( 通常は /var/opt/SMAWRrms/log/) は、vi などの UNIX の一般的なエディタを使用して表示することができます。

エラーメッセージの意味と、可能な対処方法については“付録”を参照してください。

58 J2UZ-5294-06Z0(03)

Page 67: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

トラブルシューティング RMS ログメッセージの表示

以下の手順に従って、システムノードの switchlog を表示します。

システムノード上で右クリックし、ポップアップメニューから [switchlog の表示 ] を選択します ( 図 14)。または、ノードを選択して [ ツール ] - [switchlog の表示 ] を選択します ( 図 15)。

図 14: ポップアップメニューから RMS switchlog ファイルを表示

図 15: [ ツール ] メニューから RMS switchlog を表示

以下の手順に従ってアプリケーションログを表示します。

RMS ツリー内のアプリケーション上で右クリックし、ポップアップメニューから [ ログファイルの表示 ] を選択します ( 図 16)。

図 16: ポップアップメニューからアプリケーションログを表示

オブジェクトに対応するポップアップメニューは、Cluster Admin 画面、クラスタテーブル、オブジェクトを含む任意の RMS グラフのいずれからも起動することができます。

J2UZ-5294-06Z0(03) 59

Page 68: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

RMS ログメッセージの表示 トラブルシューティング

いずれの場合でも、ログは右側パネルの専用タブに表示されます ( 図 17)。

図 17: タブビューに表示された RMS switchlog

タブを別ウィンドウで表示するには、<デタッチ>ボタンをクリックします。 <デタッチ>ボタンは、画面右上隅の<ヘルプ>ボタンと<閉じる>ボタンとの間にあります ( 図 18)。

図 18: タブ画面の<デタッチ>ボタン拡大図

別ウィンドウに表示された場合でも、内容はタブ表示と同じです ( 図 19)。

図 19: 別ウィンドウに表示された RMS switchlog

60 J2UZ-5294-06Z0(03)

Page 69: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

トラブルシューティング RMS ログメッセージの表示

切り離したウィンドウを Cluster Admin 画面に戻すには、<アタッチ>ボタンをクリックします。 <アタッチ>ボタンは、<ヘルプ>ボタンと<閉じる>ボタンとの間にあります。標準のウィンドウ制御ボタンのすぐ下です ( 図 20)。

図 20: 別ウィンドウの<アタッチ>ボタン拡大図

別ウィンドウ表示では、画面の<閉じる>ボタンとウィンドウ標準の<閉じる>ボタンの機能は同じです。どちらをクリックしてもウィンドウは閉じます。

メイン画面表示では、タブ表示画面の<閉じる>ボタンをクリックすると表示中のタブのみが閉じられます。他のタブ画面は開いたままです。

4.8.1 switchlog およびアプリケーションログを表示する一般的な手順

デフォルトでは、ウィンドウ下部のスクロール領域にログ全体が表示されます。表示されるログは、以下のフィルタで絞り込むことができます。

● [ 時刻フィルタ ] — 対象となる時間範囲を指定します。

● [ キーワードフィルタ ] — 特定のリソース名 ( アプリケーションの場合のみ )、エラーメッセージの重要度レベル、0 以外の終了コード、またはキーワードを選択します。

重要度レベルの詳細については、“4.8.3.2 重要度” を参照してください。

フィルタ項目の入力後、<フィルタ>ボタンをクリックすると、フィルタで絞り込んだログエントリが表示されます 。

[ 時刻フィルタ ] と [ キーワードフィルタ ] の両方を設定すると、両方の条件を満たしたログエントリに絞り込むことができます。

switchlog のエントリは、ログビューアウィンドウの [ 昇順 ] チェックボックスをオンまたはオフにすることにより、時系列昇順または降順にいつでも並べ替えることができます。

J2UZ-5294-06Z0(03) 61

Page 70: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

RMS ログメッセージの表示 トラブルシューティング

4.8.2 時刻フィルタ

[ 時刻フィルタ ] に日付と時刻を指定して、ログウィンドウに表示するエントリを絞り込むことができます ( 図 21)。

図 21: 日付時刻による検索

入力ボックスのスピンボタンで [ 開始時刻 ] と [ 終了時刻 ] を選択し ( 値を直接入力することもできます )、[ 有効 ] チェックボックスをオンにします。

ここでの設定は、<フィルタ>ボタンをクリックしたときに有効になります。

時刻フィルタを削除するには、[ 有効 ] チェックボックスをオフにして、<フィルタ>ボタンをクリックします。

62 J2UZ-5294-06Z0(03)

Page 71: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

トラブルシューティング RMS ログメッセージの表示

4.8.3 キーワードフィルタ

[キーワードフィルタ]パネルには、以下の項目があります。

4.8.3.1 リソース名

[リソース名]コントロールを使用できるのは、アプリケーションログの場合のみです。

ドロップダウンリストからリソース名を選択し、<フィルタ>ボタンをクリックします ( 図 22)。

図 22: リソース名による検索

リソース名のフィルタを削除するには、ドロップダウンリストで [ 選択なし ] を選択し、<フィルタ>ボタンをクリックします。

J2UZ-5294-06Z0(03) 63

Page 72: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

RMS ログメッセージの表示 トラブルシューティング

4.8.3.2 重要度

ドロップダウンリストからメッセージの重要度レベルを選択します ( 図 23)。

図 23: S 重要度による検索

表 4 に RMS の重要度レベルを説明します。

重要度レベルのフィルタを削除するには、ドロップダウンリストで [ 選択なし ] を選択し、<フィルタ>ボタンをクリックします。

4.8.3.3 0 以外の終了コード

[0 以外の終了コード ] 入力ボックスに終了コードを数値で入力し、<フィルタ>ボタンをクリックします。

重要度レベル 説明

Emergency システム使用不能

Alert 直ちに対処が必要

Critical 重要な状態(致命的なエラー)

Error エラー状態(致命的でないエラー)

Warning 注意状態

Notice 普通だが通告を要する状態

Info その他の情報

Debug デバッグメッセージ

表 4: RMS の重要度レベルの説明

64 J2UZ-5294-06Z0(03)

Page 73: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

トラブルシューティング RMS ログメッセージの表示

4.8.3.4 キーワード

[ キーワード ] ボックスに文字列を入力し、<フィルタ>ボタンをクリックします ( 図 24)。

図 24: キーワードによる検索

特殊文字および空白は使用できますが、ワイルドカードは使用できません。検索では大文字と小文字が区別されます。

キーワードのフィルタを削除するには、キーワードボックスの文字列をクリアし、<フィルタ>ボタンをクリックします。

J2UZ-5294-06Z0(03) 65

Page 74: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

RMS ログファイルのクリーンアップ トラブルシューティング

4.8.4 テキスト検索

表示中のアプリケーションログの上で右クリックして、テキスト検索を行うことができます。[ 検索 ]ポップアップダイアログで文字列を入力すると、指定した方向に向かって大文字と小文字を区別した検索が行われます ( 図 25)。

図 25: ログビューア上のポップアップ検索ダイアログ

入力した文字列は、完全一致で検索されます。スペースや特殊文字を使用することができますが、ワイルドカードは無効です。

4.8.5 フィルタの削除

すべてのフィルタを削除するには、以下の手順を行います。

● 時刻フィルタの [ 有効 ] チェックボックスをオフにします。

● ドロップダウンリストで [ 選択なし ] を選択します。

● 入力ボックスのテキストを削除します。

● <フィルタ>ボタンをクリックします。

フィルタによる絞り込みのない検索結果が再度表示されます。

4.9 RMS ログファイルのクリーンアップ

RMS では、ログファイルの管理について以下の 2 つの方法を用意しています。

1. hvlogcleanは、経過時間を基準にしてログファイルの削除やバックアップを行います。

2. hvlogcontrolは、システムの空き容量を基準にして警告の表示やログファイルの削除を行います。

いずれのユーティリティも、RMS のインストール時に自動的にインストールされ、デフォルトの設定で構成されます。このセクションでは両者の機能の概要と管理設定について説明します。

66 J2UZ-5294-06Z0(03)

Page 75: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

トラブルシューティング RMS ログファイルのクリーンアップ

4.9.1 hvlogclean

hvlogclean ユーティリティは現在のログファイルを RELIANT_LOG_PATH のバックアップサブディレクトリに保存します。ディレクトリ名には RMS が 後に起動した時刻が使用されます。-d オプションを指定して起動すると、現在のログファイルをコピーせずに削除します。いずれの場合も、hvlogcleanを実行すると、RMS が稼動中であっても新しいログファイルが作成されます。

hvlogcleanはさらに、バックアップサブディレクトリ内の古いファイルを削除します。バックアップファイルが「古い」かどうかは、RELIANT_LOG_LIFE 環境変数の値を確認することによって判定します。バックアップファイル作成の日が変数の値よりも古ければファイルは削除されます。詳細については、226 ページの “RELIANT_LOG_LIFE” を参照してください。

hvlogclean は crontab ファイルの設定で定期的に起動されますが、手動で起動することもできます。マニュアルページを参照してください。

4.9.2 hvlogcontrol

hvlogcontrolユーティリティは、ログファイルによって RELIANT_LOG_PATH が置かれたファイルシステムの空き容量がすべて消費されてしまうのを防止します。構成定義に設定された上限値に従って、hvlogcontrolは、ユーザへの警告、RELIANT_LOG_PATH のサブディレクトリのみの削除、または、すべての RMS ログファイルの削除ができます。詳細については、以下の RMS 環境変数に関する説明を参照してください。

● 225 ページの “HV_LOG_ACTION_THRESHOLD” ( グローバル )

● 225 ページの “HV_LOG_WARN_THRESHOLD” ( グローバル )

● 228 ページの “HV_LOG_ACTION” ( ローカル )

これらのコントロールを変更するには、hvenv.localファイルを編集し、RMS を再起動する必要があります。223 ページの "14.1 RMS 環境変数の設定 " を参照してください。

hvlogcontrolはcrontabファイルから定期的に起動されます。マニュアルページはありません。

4.9.3 バックグラウンドスクリプトのログ採取

Command Line サブアプリケーションは、バックグラウンドで動作する別のコマンドやスクリプトを実行するスクリプトを起動することができます。バックグラウンドプロセスが stdoutまたは stderrに書き込みをする場合、その出力はログファイルにダイレクトされ、ログファイルはプロセスが正常終了するか終了させられるまでオープンされたままです。これにより、そのログファイルは RMS ログファイルが cronジョブまたは hvlogcleanによってクリーンされる時とは異なる方法で処理されます。

hvlogcleanは、クリーンアップを行う際に古いログファイルをバックアップディレクトリに移動します。このバックアップディレクトリ名には RMS が 後に起動された時間が使用されています。バックグラウンドプロセス用のログファイルも、オープンされた状態でそこに移されます。バックグラウンドのプロセスは、オープンされたファイルへの書き込みを継続するため、その後の出力はファイルの移動先であるバックアップディレクトリに保存され、/var/opt/reliant/logには保存されません。RMS の残りのプロセスも同様です。

プロセスの実行中にバックグラウンドプロセスのログファイルが削除された場合 ( 手動またはhvlogclean -dコマンドなど )、そのログファイルはそれ以後参照することはできません。ただし、ファイルは引き続き存在しているため、バックグラウンドプロセスは、正常終了するか途中で停止されるまで、表示ができなくなったファイルに書き込みを継続します。

J2UZ-5294-06Z0(03) 67

Page 76: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

構成のトラブルシューティング トラブルシューティング

4.10 構成のトラブルシューティング

このセクションでは、標準の構成ツールで使用できるリソースのトラブルシューティングについて説明します。

4.10.1 PCS のログファイルとトレースファイル

PCS の高度な障害診断情報を採取するには、以下の 2 つの方法があります。

● PCS ログファイルを参照します。保存されている場所は、/var/opt/SMAWpcs/log/pcs.logです。PCS は、内部の不整合状態やエラーを検出すると必ず自動的に基本的な診断レポートをこのファイルに書き込みます。

● PCS 自動診断によって発見できない問題もあります。この場合には、PCS GUI で [Tools] メニューの [Trace] を選択し、トレースレベルのチェックボックスのいずれかを選択します。トレースレベルが高くなるほど、多くの情報が保存されます。トレースファイルは/var/opt/SMAWpcs/traceディレクトリに作成されます。

トレース情報は、場合により大量の出力を生じる可能性があります。問題が解決した後は、[Tools] メニューの [Trace] を選択し、チェックボックスをオフにしてトレースを停止してください。また、必要のなくなったファイルはトレースディレクトリから削除してください。

上記の PCS ログファイルは /var/opt/SMAWpcs/ ツリーに存在します。これらのファイルは実行時ではなく、構成設定の時点で生成されます。

4.10.2 手動によるスクリプトの実行

開発テスト時で、オブジェクトのスクリプト (Online、Offline など ) を 1 つずつ実行する必要が生じた場合、PCS および RMS Wizard Tools のいずれにおいても、構成定義中の任意のオブジェクトに対して実行することができます。

あるリソースについてあるスクリプトをテストするには、場合により、まず他のリソースについて別のスクリプトを実行してみることが必要です。このため、RMS が通常どのようにしてリソースを Online化 ( グラフの下から上 ) するか、Offline化 ( グラフの上から下 ) するかを正しく理解しておく必要があります。

運用中において使用する場合は、PRIMECLUSTER の対応製品のマニュアルに従ってください。

68 J2UZ-5294-06Z0(03)

Page 77: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

トラブルシューティング 構成のトラブルシューティング

4.10.2.1 PCS GUI を使用する方法

PCS GUI からスクリプトを実行するには以下の手順を使用します。

構成がすでに活性化されていることを確認します。構成を生成しただけでは不十分です。

PCS のメニューから [Tools] - [Draw Graph] を選択し、構成のグラフを開きます。

グラフ内のオブジェクトを右クリックして、手動実行が可能なスクリプトを一覧表示します ( 図 26)。

図 26: PCS グラフのコンテキストメニューからスクリプトを手動実行する

コンテキストメニュー内のスクリプト名をクリックします。

RMS が実行中の場合は、スクリプトの実行前に手順の確認を求めるメッセージが表示されます。

高可用性の運用環境でスクリプトを手動実行する場合は、起こり得る副作用について必ず事前に理解しておいてください。

手動で実行したすべてのスクリプトからの出力と復帰状態が [Manual Script Execution] ウィンドウに表示されます ( 図 27)。

図 27: PCS GUI の [Manual Script Execution] 出力ウィンドウ

後の実行結果を参照するには、必要に応じて下方にスクロールしてください。

スクリプトの出力は /var/opt/SMAWpcs/log/pcs.logファイルにも保存されます。

J2UZ-5294-06Z0(03) 69

Page 78: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

構成のトラブルシューティング トラブルシューティング

4.10.2.2 PCS CUI を使用する方法

PCS CUI からスクリプトを実行するには以下の手順を使用します。

構成がすでに活性化されていることを確認します。構成を生成しただけでは不十分です。

PCS CUI の [Configuration Start] 画面を開きます ( 図 28)。

図 28: PCS CUI の [Configuration Start] 画面

「6」を選択して [Advanced Menu] 画面を表示します ( 図 29)。

図 29: PCS CUI の [Advanced Menu]

70 J2UZ-5294-06Z0(03)

Page 79: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

トラブルシューティング 構成のトラブルシューティング

「6」を選択して 初の [Manual Script Execution Tree] 画面を表示します ( 図 30)。

図 30: PCS CUI の [Manual Script Execution Tree] — オブジェクトの選択

画面 下部のプロンプトに「MORE ITEMS: PRESS CR」というメッセージが表示された場合、< Enter >を押すとさらに別のオブジェクトが表示された画面に進みます。

実行するスクリプトを持つオブジェクトの番号を入力します。

この例では「11」を選択します。11 は 初のノードのローカルファイルシステムのインスタンスに対応します。図 31 は、このオブジェクトで使用できるスクリプトのリストです。

図 31: PCS CUI の [Manual Script Execution Tree] — スクリプトの選択

J2UZ-5294-06Z0(03) 71

Page 80: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

構成のトラブルシューティング トラブルシューティング

実行するスクリプトの番号を入力します。

ここでは、「1」を選択して OnlineScript を実行します。図 32 には実行結果が示されています。

図 32: PCS CUI の [Manual Script Execution Tree] — スクリプトの実行結果の表示

終状態は画面上部の Information 行に表示され、スクリプトの出力は画面下部に表示されます。まだ表示されていない出力がある場合は、画面 下部のプロンプトにメッセージが表示されます。

スクリプトの出力は /var/opt/SMAWpcs/log/pcs.logファイルにも保存されます。

4.10.2.3 RMS Wizard Tools を使用する方法

RMS メイン構成メニューを開きます ( 図 33)。

図 33: RMS Wizard Tools のメイン構成メニュー

「15」の [Configuration-ScriptExecution] を選択します。

[ManualExecution: Application selection] メニューが表示されます ( 図 34)。

図 34: RMS Wizard Tools [ManualExecution: Application selection] メニュー

72 J2UZ-5294-06Z0(03)

Page 81: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

トラブルシューティング RMS トラブルシューティング

アプリケーション名を選択します。ここでは、「5」の [app1] を選択します。

[ManualExecution: Resource selection] メニューが表示されます ( 図 35)。

図 35: RMS Wizard Tools [ManualExecution: Resource selection] メニュー

リソースを選択します。ここでは、「8」の [app1] を選択します。

[ManualExecution: Script selection] メニューが表示されます ( 図 36 )。

図 36: RMS Wizard Tools [ManualExecution: Script selection] メニュー

実行するスクリプトを選択します。ここでは、「6」の [PreCheckScript] を選択します。

選択されたスクリプトのログが以下のファイルに出力されます。

/var/opt/SMAWRrms/log/<application_name>.log.

4.11 RMS トラブルシューティング

問題が発生した場合、RMS はトラブルシューティングのための情報を含んだエラーメッセージを出力します。メッセージが何も出力されない場合は、問題の診断と修正に以下の方法を試してください。

● RMS が起動直後に停止する。

RMS BM は、起動時にリモートノード上の他の BM と構成チェックサムを交換します。BM 起動時のチェックサムがリモートノードのチェックサムと一致すれば、起動処理は続行します。チェックサムが不一致の場合、以下のすべての条件が当てはまるときに RMS BM はシャットダウンします。

1. 初期起動時間 (HV_CHECKSUM_INTERVALに設定される ) 内の BM のチェックサムがリモートモニタのチェックサムと異なる。

2. ノードに Online、待機中、ビジー、またはロック中のアプリケーションが存在しない。

3. この BM が Online状態のリモート BM を検出できない。

または、BM が稼動中であっても、チェックサムがローカル構成チェックサムと一致しないす

べてのリモートモニタは Offline と判断されるため、これらのモニタとメッセージを交換す

ることはできず、ローカルモニタとこれらのリモートモニタとを自動または手動により切替えることができません。

J2UZ-5294-06Z0(03) 73

Page 82: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

RMS トラブルシューティング トラブルシューティング

チェックサムが異なる場合、状況を説明するメッセージが switchlogに出力されます。

構成チェックサムの不一致は主に、手動で RMS グローバル環境変数を変更する際に、一部のノードについてだけ変更し、残りを変更しなかった場合に発生します。

対処法 :

構成チェックサムの不一致が発生している場合は、以下の手順に従ってすべてのノードの構成定義を正しく更新してください。

1. クラスタ内の全 RMS を停止する。

2. どの構成定義ファイルを使用するかを決定する。構成定義ファイル名を確認するには、それぞれのノードで 'hvdisp -a' または 'hvdisp -T SysNode' を実行します (hvdispコマンドの実行には、ルート権限は必要ありません )。

以下のいずれの場合は、構成定義ファイルの名前は同じでも、内容はそれぞれのノードで異なる場合がありますので、正しい構成定義ファイルを選択してください。

– 前回の RMS 構成定義の配布が失敗した場合

– RMS Wizards Tools がクラスタ内の複数ノードで使用された場合

3. 正しい構成定義ファイルを、作成に使用したものと同じツール (RMS Wizard Tools) を使用して配布する。手順については "RMS 導入運用手引書 " の "3.4 RMS 構成定義ファイルの作成と配布 " を参照してください。

または、既存の <configname>.usファイルを以下の方法で再配布します。

– RMS Wizard Tools の [Configuration Push]

すべてのノードへ RMS の配布が成功したことを確認してください。

4. クラスタ全ノードで RMS を起動してください。

● RMS が起動後にハングする ( プロセスは実行中だが、hvdispがハングする ) 。

ローカルノードがクラスタ内の 1 つ以上の他のノードから見て CF の LEFTCLUSTER状態の場合に、この問題が発生します。

対処法 :

すべてのクラスタノード上で「cftool -n」を呼び出して LEFTCLUSTER 状態をチェックすることにより、この問題を確認してください。

「cftool -k」を呼び出して LEFTCLUSTER状態をクリアしてください。ノードがクラスタに参入するとすぐに、RMS は稼動し続けます。再起動する必要はありません。

● RMS が起動直後にループする ( 停止する場合もある )。

CIP 構成定義ファイル /etc/cip.cf にネットマスクのエントリが含まれている場合に、この問題が発生します。これらのエントリは必要ありません (CIP によって評価されません )。ネットマスクは、IP アドレスとフォーマットが同じため RMS からは区別できません。このため、ネットマスクのエントリがあると、RMS は gethostbyaddr() の呼び出しを行います。通常は実害が発生することはありませんが、稀に OS が誤動作する可能性があります。

対処法 :

ネットマスクのエントリが /etc/cip.cfに存在することを調べてください。

ネットマスクのエントリを削除して、RMS を再起動してください。

74 J2UZ-5294-06Z0(03)

Page 83: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

トラブルシューティング RMS トラブルシューティング

● RMS が他ノードの障害を検出しても 、そのノードが強制停止されない。

SysNode が Wait状態の場合に、この問題が発生します。

対処法 :

cftool -n を使用して CF の状態を確認してください。

CF の状態が LEFTCLUSTER の場合、LEFTCLUSTER のノードを手動で停止した後、cftool-k を使用して LEFTCLUSTERを解消してください。

CF の状態が DOWN となっていることを確認したら、hvdisp -T SysNode を使用してすべての SysNodeオブジェクトの状態を確認してください 。

SysNodeが Wait状態の場合、hvutil -u SysNode を実行してください。

cftool -k コマンド、および hvutil -u コマンドを使用する場合は、必ず Wait 状態のノードを手動で停止してから実行してください。本コマンドを実行すると、アプリケーションの切替え ( フェイルオーバ ) が行われるため、Wait 状態のノードを停止せずに本コマンドを実行した場合、データが破損する可能性があります。

● RMS ベースモニタが、 クラスタのハートビートの喪失を検出しましたが、原因の手がかりがない。

この場合、システム管理者は以下のような情報採取を行ってください。

1. truss(1)、または strace(1) を使ってディテクタプロセスのログを採取する。

2. RMS とディテクタロギングを「l0 ( 小文字のエルとゼロ )」にする。

3. システム動作情報を採取する。

truss(1)/strace(1) の呼び出しとログレベルは、ScriptTimeout属性に指定された秒数が経過すると解除されます。すべての情報は、switchlogファイルに保存されます。

ディテクタ履歴などのユーザの指定による操作は、ノードがクラスタを離脱したように見えていても、引き続き各ノードで実行されています。履歴レベルを高く設定すると、ノードの性能に影響が生じ、ベースモニタのハートビートの遅れが発生する場合もあります。

対処法 :

診断情報については、switchlogを参照してください。

J2UZ-5294-06Z0(03) 75

Page 84: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

高度なトラブルシューティングのための情報収集 トラブルシューティング

4.12 高度なトラブルシューティングのための情報収集

このセクションで説明する手順は高度なデバッグ情報の収集の方法で、コンサルタントや開発者を対象にしています。

4.12.1 hvdump コマンドの使用 (RMS)

hvdump コマンドは、ローカルノードの RMS のデバッグ情報を取得する場合に使用します。RMS をインストールすると以下のファイルが作成されます。

RELIANT_PATH/bin/hvdump

デフォルトでは、RELIANT_PATH は /opt/SMAW/SMAWRrmsに設定されています。このファイルのシンボリックリンクも/usr/bin/hvdump (通常はデフォルトの検索パス) および/opt/SMAW/bin/hvdumpに作成されます。

hvdump を実行すると、ログファイルと構成データを検索し、RELIANT_PATH ディレクトリの以下のアーカイブに保存します。

<nodename>RMS.<timestamp>.debug_information.tar.<suf>

サフィックス <suf> は Linux プラットフォームでは gz、Solaris プラットフォームでは Zです。

アーカイブファイルは RMS のサポート技術者が使用することを目的としています。hvdump(1M) のマニュアルページには、ファイル名とアーカイブに含まれる情報の詳細なリストが記載されています。

76 J2UZ-5294-06Z0(03)

Page 85: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

5 付録 — 致命的でないエラーメッセージ (Non-fatal error messages)

この章では、switchlog ファイルに現れる致命的でない (non-fatal) RMS エラーメッセージについて詳しく説明します。ほとんどのメッセージには、問題の原因と対処方法が併記されています。ただし、メッセージそのものが問題の説明や対処方法を表すものである場合には説明はありません。

また一部のメッセージには、斜体 ( イタリック ) のテキストが含まれています。これらの斜体部分はプレースホルダーであり、エラーメッセージが出力される場合には、実際の値、名称、文字列に置き換えられます。

RMS エラーコードの説明

各メッセージのプリフィックスには、問題を検出した RMS コンポーネントを示すエラーコードとメッセージ番号が含まれています。このプリフィックスは、必要に応じて問題の診断にあたる当社技術員 (SE)に提供してください。以下にエラーコードとそれに関連するコンポーネントを示します。

ADC: Admin 構成

ADM: Admin キュー、コマンドキュー、およびディテクタキュー

BAS: 起動および構成設定エラー

BM: BM

CML: コマンドライン

CRT: コントラクトとコントラクトジョブ

CTL: コントローラ

CUP: userApplicationコントラクト

DET: ディテクタ

GEN: 汎用ディテクタ

INI: initスクリプト

MIS: その他

QUE: メッセージキュー

SCR: スクリプト

SWT: 切替要求 (hvswitchコマンド )

SYS: SysNode

UAP: userApplication

US: usファイル

WLT: Waitリスト

WRP: ラッパ

J2UZ-5294-06Z0(03) 77

Page 86: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

ADC: Admin 構成 付録 — 致命的でないエラーメッセージ

5.1 ADC: Admin 構成

● (ADC, 1) Since this host <hostname> has been online for no more than time seconds and due to the previous error, it will shut down now.

time は、RMS 環境変数 HV_CHECKSUM_INTERVALの値でデフォルト値は、120 秒です。このメッセージが出力されるのは、ローカルノードとリモートノードの RMS 構成のチェックサムが異なり、かつ経過時間が time 秒以内であり、かつ以下のいずれかの条件が満たされる場合です。

– リモートノードがクラスタに参入し、ローカルノード上のすべてのアプリケーションがOfflineまたは Faultedの状態である。RMS が終了コード 60で終了する。

– リモートノードの構成にローカルノードが含まれているが、ローカルノードの構成にリモートノードが含まれていない。ローカルノード hostname が終了コード 60で終了する。

対処法 :

ローカルノードおよびリモートノードは別々の構成設定で実行されています。両方のノードが同じ構成設定で実行するようにしてください。構成定義ファイルの作成および保守には、必ず標準の PRIMECLUSTER 構成ツールを使用してください。

● (ADC, 2) Since not all of the applications are offline or faulted on this host <hostname>, and due to the previous error, it will remain online, but neither automatic nor manual switchover will be possible on this host until <detector> detector will report offline or faulted.

ローカルノードとリモートノードの RMS 構成のチェックサムが異なり、経過時間がHV_CHECKSUM_INTERVALに指定された秒数以内であり、Offlineまたは Faultedでないアプリケーションが存在します。RMS は Online状態を維持しますが、ディテクタ detector がOfflineまたは Faultedを報告するまでは、このノード上で自動切替および手動切替のいずれもできません。

対処法 :

ローカルノードとリモートノードの両方が同じ RMS 構成で稼動するようにしてください。

● (ADC, 3) Remote host <hostname> reported the checksum (remotechecksum) which is different from the local checksum (localchecksum).

リモートノード <hostname> が報告する RMS 構成定義ファイルのチェックサムが、ローカルノード上の RMS 構成定義ファイルのチェックサムと異なる場合に、このメッセージが出力されます。

対処法 :

ローカルノードとリモートノードが異なる RMS 構成定義ファイルで実行されています。ローカルノードとリモートノードが同じ RMS 構成定義ファイルで実行するようにしてください。

● (ADC, 4) Host <hostname> is not in the local configuration.

このメッセージが出力される原因は次のとおりです。リモートノードが報告するチェックサムがローカルノードのチェックサムと異なり、ローカルノードの RMS 構成定義ファイルにリモートノード名が含まれていないにもかかわらず、リモートノード hostname の RMS 構成定義ファイルにローカルノードが含まれています。

対処法 :

ローカルノードとリモートノードが同じ RMS 構成で稼動するようにしてください。

78 J2UZ-5294-06Z0(03)

Page 87: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的でないエラーメッセージ ADC: Admin 構成

● (ADC, 5) Since this host <hostname> has been online for more than time seconds, and due to the previous error, it will remain online, but neither automatic nor manual switchover will be possible on this host until <detector> detector will report offline or faulted.

ローカルノードとリモートノードの RMS 構成定義ファイルのチェックサムが異なり、このノードがオンラインになってから time 秒以上が経過した場合に、RMS が上記のメッセージを出力します(環境変数 HV_CHECKSUM_INTERVAL が設定されている場合、time はその値です。HV_CHECKSUM_INTERVAL が設定されていない場合、time は 120 秒です)。

対処法 :

クラスタ内のすべてのノードが同じ RMS 構成定義ファイルを実行するようにしてください。

● (ADC, 15) Global environmental variable <envattribute> is not set up in hvenv file.

このメッセージは、グローバル環境変数 <envattribute> が hvenv に設定されていないことが原因で RMS がこの変数の設定に失敗した場合に出力されます。envattribute は次のいずれかです :

RELIANT_LOG_LIFE、RELIANT_SHUT_MIN_WAIT、HV_CHECKSUM_INTERVAL、HV_LOG_ACTION_THRESHOLD、HV_LOG_WARNING_THRESHOLD、 HV_WAIT_CONFIG、HV_RCSTART。これにより RMS は終了コード 1 で終了します。

対処法 :

環境変数に適切な値を設定してください。

● (ADC, 17) <hostname> is not in the Wait state, hvutil -u request skipped!

hvutil -u をノード上で呼び出したが、SysNode が Wait 状態ではありませんでした(内部オプション)。

対処法 :

hvutil -uコマンドを発行するのが早すぎた場合は、ノードが Wait状態になってから再発行してください。

● (ADC, 18) Local environmental variable <envattribute> is not set up in hvenv file.

このメッセージは、ローカル環境変数 <envattribute> が hvenvに設定されていないことが原因でRMS がこの変数の設定に失敗した場合に出力されます。envattribute は次のいずれかです。 SCRIPTS_TIME_OUT、RELIANT_INITSCRIPT、RELIANT_STARTUP_PATH、HV_CONNECT_TIMEOUT、HV_MAXPROC、HV_SYSLOG_USE。これにより RMS は終了コード 1で終了します。

対処法 :

/opt/SMAW/SMAWRrms/bin/hvenv.local ファイルの環境変数に適切な値を設定してください。

● (ADC, 20) <hostname> is not in the Wait state. hvutil -o request skipped!

hvutil -oをノード上で呼び出したが、SysNodeが Wait状態ではありませんでした ( 内部オプション )。

対処法 :

hvutil -o コマンドを発行するのが早すぎた場合は、ノードが Wait状態になってから再発行してください。

J2UZ-5294-06Z0(03) 79

Page 88: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

ADC: Admin 構成 付録 — 致命的でないエラーメッセージ

● (ADC, 25) Application <userapplication> is locked or busy, modification request skipped.

アプリケーションが他の処理を実行中の場合にこのメッセージが表示されます。

対処法 :

クラスタアプリケーションが現在の切替要求を完了した時点で、再度実行してください。

● (ADC, 27) Dynamic modification failed.

動的変更が失敗しました。障害の原因は先行するメッセージに表示されています。

対処法 :

switchlog でこのメッセージの前に出力されたエラーメッセージを調べるか、または失敗の正確な原因を突き止めてください。

● (ADC, 30) HV_WAIT_CONFIG value <seconds> is incorrect, using 120 instead.

環境変数 HV_WAIT_CONFIGの値が 0となっています。値が設定されていない場合は、代わりにデフォルト値の 120 が使用されます。

対処法 :

/opt/SMAW/SMAWRrms/bin/hvenvで HV_WAIT_CONFIGの値を設定してください。

● (ADC, 31) Cannot get the NET_SEND_Q queue.

RMS はコントラクト情報の送信に NET_SEND_Qキューを使用します。このキューに問題がある場合、処理は中止されます。この処理には、hvrcpまたは hvcopyのいずれかを使用します。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (ADC, 32) Message send failed during the file copy of file <file>.

ネットワーク上でファイル <file> を転送中にエラーが発生しました。

対処法 :

ネットワークに問題がないかどうかを確認してください。

● (ADC, 33) Dynamic modification timeout.

動的変更の所要時間がタイムアウト値を超えました。環境変数 MODIFYTIMEOUTLIMITの値が 0より大きい場合、タイムアウトはその値になります。環境変数の値が 0以下の場合、タイムアウトは 0です。環境変数自体が定義されていない場合、タイムアウト値はデフォルトで 120秒です。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

80 J2UZ-5294-06Z0(03)

Page 89: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的でないエラーメッセージ ADC: Admin 構成

● (ADC, 34) Dynamic modification timeout during start up, bm will exit.

bm起動中に動的変更の所要時間が環境変数 MODIFYTIMEOUTLIMITに指定されるタイムアウト値を超えるとこのメッセージが出力されます。値が 0より大きい場合、タイムアウトはその値になります。環境変数の値が 0以下の場合、タイムアウトは 0です。環境変数自体が定義されていない場合、タイムアウト値はデフォルトで 120秒です。RMS は終了コード 63で終了します。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (ADC, 35) Dynamic modification timeout, bm will exit.

重大な内部エラーが発生しました。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (ADC, 37) Dynamic modification failed: cannot make a non-critical resource <resource> critical by changing its attribute MonitorOnly to 0 since this resource is not online while it belongs to an online application <userapplication>; switch the application offline before making this resource critical.

クラスタアプリケーション <userapplication> が Online のときに、動的変更によりリソース<resource> を MonitorOnly にしようとすると、変更したいリソース <resource> が Online ではなくても、このメッセージが生成されて、動的変更が中止されます。

対処法 :

クラスタアプリケーションを Offlineに切替えてからリソースの重要度を上げてください。

● (ADC, 38) Dynamic modification failed: application <userapplication> has no children, or its children are not valid resources.

動的変更の実行中に、クラスタアプリケーション <userapplication> が子を持たないことがわかると、このメッセージが switchlogに書込まれ、動的変更が異常終了します。

対処法 :

動的変更の実行中に、クラスタアプリケーションに有効な子があることを確認してください。

● (ADC, 39) The putenv() has failed (failurereason)

RMS ウィザードは動的変更 HVMOD_HOST の実行中に環境変数 HVMOD_HOST を使用します。この変数には、hvmodを呼び出したノードの名前が含まれています。この変数を関数 putenv() で設定できない場合は、このメッセージと理由 failurereason が switchlogに書込まれます。

対処法 :

switchlogで理由 failurereason を調べて、この操作が失敗した理由を判別し、修正措置をとってください。

J2UZ-5294-06Z0(03) 81

Page 90: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

ADC: Admin 構成 付録 — 致命的でないエラーメッセージ

● (ADC, 41) The Wizard action failed (command)

ウィザードは hvmodの実行中にアクションファイルを使用します。終了コールでプロセスが終了する際、このアクションファイル (command) の実行が失敗すると、このメッセージと失敗の理由が switchlogに書込まれます。

対処法 :

switchlogを調べて失敗の理由を検出し、問題を解決してから hvmodコマンドを再発行してください。

● (ADC, 43) The file transfer for <filename> failed in "command". The dynamic modification will be aborted.

動的変更の実行中に、変更情報を記録したファイルがクラスタのノード間での転送に失敗しました。

対処法 :

ノードとクラスタが command を正常に実行できる状態になっていることを確認してください。

● (ADC, 44) The file transfer for <filename> failed in "command". The join will be aborted.

ノードはクラスタに参入すると、RMS 構成定義ファイルを受信します。ファイル転送が失敗すると、動的変更は中止されます。

対処法 :

ノードとクラスタが command を正常に実行できる状態になっていることを確認してください。

● (ADC, 45) The file transfer for <filename> failed in "command" with errno <errno> - errorreason.The dynamic modification will be aborted.

動的変更の実行中に、変更情報を記録したファイルがクラスタのノード間での転送に失敗しました。ファイル転送が失敗すると、動的変更は中止されます。このエラーの具体的な理由を調べるには、OS エラーコード ERRNO および ERRORREASON の説明を参照してください。

対処法 :

ノードとクラスタが command を正常に実行できる状態になっていることを確認してください。

● (ADC, 46) The file transfer for <filename> failed with unequal write byte count, expected expectedvalue actual actualvalue. The dynamic modification will be aborted.

動的変更の実行中に、変更情報を記録したファイルがクラスタのノード間での転送に失敗しました。

対処法 :

ノード、クラスタ、およびネットワークが command を正常に実行できる状態になっていることを確認してください。

● (ADC, 47) RCP fail:can't open file filename.

ローカルノードからリモートノードにコピーするファイル <filename> を開いて読込むことができない場合、このメッセージが出力されます。

対処法 :

ファイル <filename> を読込めることを確認してください。

● (ADC, 48) RCP fail:fseek errno errno.

82 J2UZ-5294-06Z0(03)

Page 91: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的でないエラーメッセージ ADC: Admin 構成

ノード間のファイル転送中に OS エラーコード ERRNO で示される問題が発生しました。

対処法 :

ノード、クラスタ、およびネットワークがファイル転送を正常に実行できる状態になっていることを確認してください。

● (ADC, 49) Error checking hvdisp temporary file <filename>, errno <errno>, hvdisp process pid <processid> is restarted.

RMS BM ( ベースモニタ ) は、構成データを hvdispプロセスに転送するために使用する一時ファイルの整合性とサイズを定期的に確認します。このファイルを確認できないときは hvdispプロセスを自動的に再起動しますが、このとき一部のファイルが失われて表示されない場合があります。発生したエラーの OS エラーコードは ERRNO に表示されます。

対処法 :

ノードが一時ファイルを確認できる状態になっていることを確認してください。場合によっては hvdispプロセスを手動で再起動する必要があります。

● (ADC, 57) An error occurred while writing out the RMS configuration for the joining host. The hvjoin operation is aborted.

リモートノードはクラスタに参入するときに固有の RMS 構成定義ファイルをコピーし、リモートノードに転送しようとします。RMS 構成定義ファイルを保存できない場合、hvjoinの処理は中止されます。

対処法 :

RMS構成定義ファイルの保存中に発生したエラーに関する詳しい説明が以前のメッセージの1つに記述されています。この説明に従ってノード環境を修正するか、当社技術員 (SE) に連絡してください。

● (ADC, 58) Failed to prepare configuration files for transfer to a joining host. Command used <command>.

リモートノードはクラスタに参入するときに固有の RMS 構成定義ファイルを準備し、リモートノードに転送しようとします。そのためにコマンド <command> を使用します。<command> が失敗した場合、hvjoinの処理は中止されます。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (ADC, 59) Failed to store remote configuration files on this host. Command used <command>.

ノードはクラスタに参入するときにリモート構成定義ファイルを保存し、動的変更を実行しようとします。そのためにコマンド <command> を使用します。<command> が失敗した場合、hvjoinの処理は中止されます。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (ADC, 60) Failed to compress file <file>. Command used <command>.

J2UZ-5294-06Z0(03) 83

Page 92: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

ADC: Admin 構成 付録 — 致命的でないエラーメッセージ

ファイル転送は動的変更や hvjoinなどの RMS 機能の一部です。ファイル <file> をリモートノードに転送する前にコマンド <command> で圧縮する必要があります。<command> が失敗すると、ファイル転送を伴う処理は中止されます。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (ADC, 61) Failed to shut down RMS on host <host>.

クラスタ内のすべてのノードでRMSをシャットダウンしようとしましたが、ノード<host>のRMSのシャットダウンに失敗しました。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (ADC, 62) Failed to shut down RMS on this host, attempting to exit RMS.

クラスタ内のすべてのノードで RMS をシャットダウンしようとしましたが、このノードの RMSのシャットダウンに失敗しました。シャットダウンは自動的に再試行されます。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (ADC, 63) Error <errno> while reading file <file>, reason: <reason>.

ファイル <file> の読取り中にエラー<errno> が発生しました。理由は <reason> に示されます。ファイル読取りエラーは動的変更または hvjoinの処理中に発生する場合があります。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (ADC, 68) Error <errno> while opening file <file>, reason:<reason>.

ファイル <file> を開こうとした際に、<reason> が理由で、エラー <errno> が発生しました。ファイルのオープンエラーは、動的変更の間に発生する可能性があります。

対処法 :

ファイルの存在を確認してから動的変更要求を再度発行してください。

● (ADC, 70) Message sequence # is out of sync - File transfer of file <filename> has failed.

重大な内部エラーが発生しました。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

84 J2UZ-5294-06Z0(03)

Page 93: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的でないエラーメッセージ ADM: Admin キュー、コマンドキュー、およびディテクタキュー

5.2 ADM: Admin キュー、コマンドキュー、およびディテクタキュー

● (ADM, 3) Dynamic modification failed: some resource(s) supposed to come offline failed.

動的変更の実行中に、新しいリソースを親オブジェクトに追加して、リソースを Offlineにできないときに、このメッセージが出力されます。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (ADM, 4) Dynamic modification failed: some resource(s) supposed to come online failed.

Onlineスクリプトを実行して、新規リソースを Online状態の親オブジェクトに追加する場合、そのリソースを Onlineにできないと、動的変更は中止されます。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (ADM, 5) Dynamic modification failed: object <object> is not linked to any application.

動的変更の実行中に、親を持たない ( したがって、すべてのクラスタアプリケーションにリンクされていない ) オブジェクト <object> を追加しようとすると、このメッセージが出力されて、動的変更が中止されます。

対処法 :

動的変更の実行中に追加するすべてのオブジェクトがクラスタアプリケーションにリンクされていることを確認してください。

● (ADM, 6) Dynamic modification failed: cannot add new resource <resource> since another existing resource with this name will remain in the configuration.

既存のリソースと同じ名前の新規リソース <resource> を追加しようとすると、このメッセージがswitchlogに書込まれて、動的変更が中止されます。

対処法 :

新規リソースを追加するときに、その名前が他の既存のリソースと同じでないことを確認してください。

● (ADM, 7) Dynamic modification failed: cannot add new resource <resource> since another existing resource with this name will not be deleted.

既存のリソースと同じ名前の新規リソース <resource> を追加しようとすると、このメッセージが出力されて、動的変更が中止されます。

対処法 :

新規リソースを追加するときに、その名前が他の既存のリソースと同じでないことを確認してください。

J2UZ-5294-06Z0(03) 85

Page 94: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

ADM: Admin キュー、コマンドキュー、およびディテクタキュー 付録 — 致命的でないエラーメッセージ

● (ADM, 8) Dynamic modification failed: cycle of length <cycle_length> detected in resource <resource> -- <cycle>.

RMS リソースのグラフ全体で、親 - 子リンクのチェーンに循環部分があってはいけません。循環部分があると、動的変更が失敗し、上記のメッセージが switchlogに書込まれます。

対処法 :

循環部分を削除してください。

● (ADM, 9) Dynamic modification failed: cannot modify resource <resource> since it is going to be deleted.

リソースを削除すると、そのリソースの子で他の親を持たない子もすべて削除されます。したがって、リソースを削除して、削除したリソースの属性、またはそのリソースの子で他の親を持たない子の属性を変更すると、動的変更が中止され、上記のメッセージが switchlogに書込まれます。

対処法 :

リソースの動的変更を実行するときに、変更するリソースが削除されていないことを確認してください。

● (ADM, 11) Dynamic modification failed: cannot delete object <resource> since it is a descendant of another object that is going to be deleted.

子オブジェクトを削除しようとしたときに、その親オブジェクトが削除されていると、上記のメッセージが switchlogに書込まれて、動的変更が中止されます。

対処法 :

オブジェクトを明示的に削除するときに、その親が削除されていないことを確認してください。親が削除されていると、その子も削除されていることになるからです。

● (ADM, 12) Dynamic modification failed: cannot delete <resource> since its children will be deleted.

リソース <resource> を削除しようとしたときに、その子が削除されていると、上記のメッセージが switchlogに書込まれて、動的変更が中止されます。

対処法 :

リソースを明示的に削除するときに、その子が削除されていないことを確認してください。

● (ADM, 13) dynamic modification failed:object <resource> is in state <state> while needs to be in one of stateOnline, stateStandby, stateOffline, stateFaulted, or stateUnknown.

すべてのリソースは、stateOnline、stateOffline、stateFaulted、stateUnknown、stateStandbyのいずれかの状態である必要があります。リソース <resource> がこれらの状態のいずれでもない場合は、上記のメッセージが書込まれて、動的変更が中止されます。理論的に、このようなことはあり得ません。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

86 J2UZ-5294-06Z0(03)

Page 95: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的でないエラーメッセージ ADM: Admin キュー、コマンドキュー、およびディテクタキュー

● (ADM, 14) Dynamic modification failed: cannot link to or unlink from an application <userapplication>.

リソースの親がクラスタアプリケーションの場合、その親に子をリンクしたり、その親の子をリンク解除することはできません。これらの操作を実行しようとすると、上記のメッセージがswitchlogに書込まれて、動的変更が中止されます。

対処法 :

クラスタアプリケーションにリソースをリンクしたり、クラスタアプリケーションからリソースをリンク解除してはいけません。

● (ADM, 15) Dynamic modification failed: parent object <parentobject> is not a resource.

動的変更の実行中に、既存のリソースをリンクしようとしたときに、子オブジェクトのリンク先である親オブジェクト <parentobject> がリソースでない場合、動的変更が失敗して、このメッセージが出力されます。

対処法 :

2 つのオブジェクトをリンクするときに、子オブジェクトの親がリソースであることを確認してください。

● (ADM, 16) Dynamic modification failed: child object <childobject> is not a resource.

動的変更の実行中に、既存のリソースをリンクしようとしたときに、親オブジェクトにリンクされる子オブジェクト <childobject> がリソースでない場合、動的変更が失敗して、このメッセージが出力されます。

対処法 :

2 つのオブジェクトをリンクするときに、親オブジェクトの子がリソースであることを確認してください。

● (ADM, 17) Dynamic modification failed: cannot link parent <parentobject> and child <childobject> since they are already linked.

すでにリンクされている親 <parentobject> と子 <childobject> をリンクしようとすると、このメッセージが出力されます。動的変更が中止されます。

対処法 :

動的変更を実行するときに、リンクしようとする親と子がリンク済みでないことを確認してください。

● (ADM, 18) Dynamic modification failed: cannot link a faulted child <childobject> to parent <parentobject> which is not faulted.

動的変更の実行中に、2 つの既存オブジェクト間で新しいリンクを作成するときに、障害のある子 <childobject> を、障害のない親 <parentobject> にリンクすることはできません。 初に、子を親と同じ状態にする必要があります。この操作を実行できない場合は、上記のメッセージがswitchlogに書込まれます。動的変更が中止されます。

対処法 :

障害の発生している子を親と同じ状態にしてから、子と親をリンクしてください。

J2UZ-5294-06Z0(03) 87

Page 96: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

ADM: Admin キュー、コマンドキュー、およびディテクタキュー 付録 — 致命的でないエラーメッセージ

● (ADM, 19) Dynamic modification failed: cannot link child <childobject> which is not online to online parent <parentobject>.

動的変更の実行中に、2 つの既存オブジェクトをリンクするときに、Onlineの親と Onlineでない子をリンクすることはできません。これらの親と子をリンクしようとすると、動的変更が中止されて、メッセージが switchlogに書込まれます。

対処法 :

初に、子 <childobject> を Onlineにしてから、Onlineの親 <parentobject> にリンクしてください。

● (ADM, 20) Dynamic modification failed: cannot link child <childobject> which is neither offline nor standby to offline or standby parent <parentobject>.

2 つの既存オブジェクトをリンクしようとしたときに、子の状態が Offlineまたは Standbyではなく、親の状態が Offlineまたは Standbyの場合、これらのオブジェクトをリンクすることはできず、上記のメッセージが switchlogに書込まれます。動的変更が中止されます。

対処法 :

まず、子を Offline または Standby にしてから、Offline または Standby の親にリンクしてください。

● (ADM, 21) Dynamic modification failed: Cannot unlink parent <parentobject> and child <childobject> since they are not linked.

リンクされていないオブジェクト <parentobject> とオブジェクト <childobject> をリンク解除しようとすると、このメッセージが出力されて、動的変更が中止されます。

対処法 :

2 つのノードをリンク解除する場合に、2 つのオブジェクトが親子関係であることを確認してください。

● (ADM, 22) Dynamic modification failed: child <childobject> will be unlinked but not linked back to any of the applications.

どのクラスタアプリケーションとのリンクも残らないように子オブジェクト <childobject> をリンク解除することはできません。

対処法 :

子がまだクラスタアプリケーションとリンクされていることを確認してください。

● (ADM, 23) Dynamic modification failed: sanity check did not pass for linked or unlinked objects.

動的変更では、いくつかの整合性チェックが行われます。整合性チェックで、以下のすべての条件が満たされていることを確認します。

1. クラスタアプリケーションオブジェクトの子だけに、HostName属性が存在すること。

2. クラスタアプリケーションの子が別の親を持たないこと。

3. 各オブジェクトが 1 つのクラスタアプリケーションだけに属していること。

4. リーフオブジェクトがディテクタを持っていること。

5. DeviceName属性を持つリーフオブジェクトの属性値が有効であること。

6. リーフオブジェクトの rName属性の長さが 大値より小さいこと。

7. hvgdstartupファイルに重複行が存在しないこと。

8. ディテクタの kind引数が hvgdstartupで指定されていること。

9. ディテクタがロード可能であること。

10. rKind属性の有効値が指定されていること。

88 J2UZ-5294-06Z0(03)

Page 97: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的でないエラーメッセージ ADM: Admin キュー、コマンドキュー、およびディテクタキュー

11. ScriptTimeoutの値がディテクタの通知間隔より大きいこと。

12. 同時に andおよび orになっているオブジェクトがないこと。

13. ClusterExclusiveと LieOfflineが相互排他的で、いっしょに使用されていないこと。

これらの整合性チェックが失敗すると、このメッセージが出力されて、動的変更が中止されます。FATAL メッセージと整合性チェックが失敗した詳しい理由も、switchlogに書込まれます。

対処法 :

上記の整合性チェックが成功するようにしてください。

● (ADM, 24) Dynamic modification failed: object <object> that is going to be linked or unlinked will be either deleted, or unlinked from all applications.

オブジェクト <object> を RMS リソースグラフから削除して、そのオブジェクトを親オブジェクトから(または親オブジェクトをそのオブジェクトから)リンク解除しようとすると、動的変更が中止され、上記のメッセージが switchlog に書き込まれます。

対処法 :

削除とリンク解除を同時にオブジェクトに対して実行しないようにしてください。

● (ADM, 25) Dynamic modification failed: parent object <parentobject> is absent.

新規オブジェクトを既存の RMS 構成定義ファイルに追加するときは、既存のオブジェクト<parentobject> が新規オブジェクトの親である必要があります。そうでないと、動的変更が中止され、上記のメッセージが switchlogに書込まれます。

対処法 :

追加する新規オブジェクトに対して指定した親が存在することを確認してください。

● (ADM, 26) Dynamic modification failed: parent object <parentobject> is neither a resource nor an application.

新規オブジェクトを既存の RMS 構成定義ファイルに追加するときに、指定した親オブジェクト<parentobject> がリソースでないと、動的変更が中止され、上記のメッセージが書き込まれます。動的変更が中止されます。

対処法 :

新規オブジェクトに対して指定した親オブジェクトがリソースであることを確認してください。

● (ADM, 27) Dynamic modification failed -- child object <childobject> is absent.

存在しない子オブジェクト <childobject> にリンクしようとすると、このメッセージが出力され、動的変更が中止されます。

対処法 :

リンク先の子オブジェクトが存在することを確認してください。

● (ADM, 28) Dynamic modification failed: child object <childobject> is not a resource.

既存の RMS 構成定義ファイルに追加する新規オブジェクト <childobject> がリソースでないと、このメッセージが出力されます。動的変更が中止されます。

対処法 :

指定した子オブジェクトがリソースであることを確認してください。

J2UZ-5294-06Z0(03) 89

Page 98: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

ADM: Admin キュー、コマンドキュー、およびディテクタキュー 付録 — 致命的でないエラーメッセージ

● (ADM, 29) Dynamic modification failed -- parent object <parentobject> is absent.

対処法 :

重大なエラーです。このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (ADM, 30) Dynamic modification failed: parent object <parentobject> is not a resource.

動的変更の実行中に、リソースではない新規オブジェクトを親オブジェクト <parentobject> として追加しようとすると、このメッセージが出力されます。動的変更が中止されます。

対処法 :

親オブジェクトとして追加するオブジェクトがリソースであることを確認してください。

● (ADM, 31) Dynamic modification failed: child object <childobject> is absent.

動的変更の実行中に、指定した子オブジェクト <childobject> が存在しないと、このメッセージが出力されます。動的変更が中止されます。

対処法 :

指定した子オブジェクトが存在することを確認してください。

● (ADM, 32) Dynamic modification failed: child object <childobject> is not a resource.

新規オブジェクトを RMS リソースグラフに追加するときに、この新規オブジェクトの子<childobject> がリソースでないと、このメッセージが出力され、動的変更が中止されます。

対処法 :

新規オブジェクトを追加するときに、その子がリソースであることを確認してください。

● (ADM, 33) Dynamic modification failed: object <object> cannot be deleted since either it is absent or it is not a resource.

存在しないまたはリソースではないオブジェクト <object> を削除しようとすると、このメッセージが出力されます。動的変更が中止されます。

対処法 :

存在しないオブジェクトを削除しないようにしてください。

● (ADM, 34) Dynamic modification failed: deleted object <object> is neither a resource nor an application nor a host.

動的再構成の間にリソースタイプのオブジェクト、userApplication、SysNode オブジェクトは削除できません。動的再構成の間に削除が許されるのは、リソース、アプリケーション、ノード (SysNodeオブジェクト ) のみです。

対処法 :

オブジェクトを削除する場合は、これ以外のオブジェクトを削除してください。

90 J2UZ-5294-06Z0(03)

Page 99: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的でないエラーメッセージ ADM: Admin キュー、コマンドキュー、およびディテクタキュー

● (ADM, 37) Dynamic modification failed: resource <object> cannot be brought online and offline/standby at the same time.

リソース <object> が既存の RMS リソースグラフに追加し、そのリソースが 2 つの親オブジェクトの子としてリンクされ、一方の親が Onlineで、もう一方の親が Offlineまたは Standbyの場合にこのメッセージが出力されます。 子オブジェクトを親と同じ状態にする必要があります。

対処法 :

追加するリソースの両方の親が同じ状態であることを確認してから、リソースを追加してください。

● (ADM, 38) Dynamic modification failed: existing parent resource <parentobject> is in state <state> but needs to be in one of stateOnline, stateStandby, stateOffline, stateFaulted, or stateUnknown.

動的変更の実行中に、親リソース <parentobject> の状態 <state> が、stateOnline、stateOffline、stateFaulted、または stateUnknownでない場合は、動的変更が中止されます。

対処法 :

親リソースの状態が上記のいずれかであることを確認してください。

● (ADM, 39) Dynamic modification failed: new resource object which is a child of application <userapplication> has its HostName <hostname> the same as another child of application <userapplication>.

新規オブジェクト object をクラスタアプリケーション <userapplication> の子として追加し、そのHostName属性値がクラスタアプリケーション <userapplication> の既存の子の HostName属性値と同じ場合に、このメッセージが出力されます。動的変更が中止されます。

対処法 :

クラスタアプリケーションに追加するオブジェクトの HostName 属性が一意な値であることを確認してください。

● (ADM, 40) Dynamic modification failed: a new child <childobject> of existing application <userapplication> does not have its HostName set to a name of any SysNode.

動的変更の実行中に、新しい子オブジェクト <childobject> をアプリケーション <userapplication>に追加するときに、このオブジェクトの HostName属性が指定されていないとこのメッセージが出力されます。動的変更が中止されます。

対処法 :

userapplication の下の第 1 レベルオブジェクトに対して HostName属性が指定されていることを確認してください。

● (ADM, 41) Dynamic modification failed: existing child <childobject> is not online, but needs to be linked with <parentobject> which is supposed to be brought online.

親 <parentobject> と子 <childobject> の両方にディテクタが関連付けられていて、子の状態はOnlineではないが、Onlineになる予定の親に子をリンクする必要がある場合に、このメッセージが出力され、動的変更が中止されます。

対処法 :

親と子が同じ状態であることを確認してください。

J2UZ-5294-06Z0(03) 91

Page 100: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

ADM: Admin キュー、コマンドキュー、およびディテクタキュー 付録 — 致命的でないエラーメッセージ

● (ADM, 42) Dynamic modification failed: existing child <childobject> is online, but needs to be linked with <parentobject> which is supposed to be brought offline.

Onlineの子 <childobject> を、Offlineになる予定の親オブジェクトにリンクすることはできません。動的変更が中止されます。

対処法 :

親と子が同じ状態であることを確認してください。

● (ADM, 43) Dynamic modification failed: linking the same resource <childobject> to different applications <userApplication1> and <userApplication2>.

異なるクラスタアプリケーション <userApplication1> および <userApplication2> に属する親リソースと子リソースを持つ新しい子オブジェクト <childobject> を追加しようとすると、このメッセージが出力されます。動的変更が中止されます。

対処法 :

新規リソースを追加するときに、その親リソースと子リソースが異なるクラスタアプリケーションに属していないことを確認してください。

● (ADM, 44) Dynamic modification failed: object <object> does not have an existing parent.

既存の親を持たないオブジェクト <object> を作成しようとすると、このメッセージが出力されます。動的変更が中止されます。

対処法 :

オブジェクト <object> が既存のオブジェクトを親として持つことを確認してください。

● (ADM, 45) Dynamic modification failed: HostName is absent or invalid for resource <object>.

オブジェクト <object> の HostName属性の値が無効な場合に、このメッセージが出力されて、動的変更が中止されます。HostName属性がない場合は、(ADM, 40) のメッセージが出力されます。

対処法 :

リソース <object> の HostName属性を有効な SysNodeの名前に設定してください。

● (ADM, 46) Dynamic modification failed: linking the same resource <object> to different applications <userapplication1> and <userapplication2>.

異なるクラスタアプリケーション <userapplication1> および <userapplication2> に属する親オブジェクトに、新しい子オブジェクト <object> をリンクして追加しようとすると、このメッセージが出力されます。動的変更が中止されます。

対処法 :

新しい子リソースを追加するときに、その親リソースが異なるクラスタアプリケーションに属していないことを確認してください。

92 J2UZ-5294-06Z0(03)

Page 101: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的でないエラーメッセージ ADM: Admin キュー、コマンドキュー、およびディテクタキュー

● (ADM, 47) Dynamic modification failed: parent object <parentobject> belongs to a deleted application.

<parentobject> を親として持つノードを新規追加する場合、その <parentobject> が削除済みオブジェクトの子であるときは、新規オブジェクトを追加できません。オブジェクトを削除すると、その子が他の親を持たない場合は、子も自動的に削除されます。これにより動的変更が失敗します。

対処法 :

新規オブジェクトを追加するときに、その親が削除されていないことを確認してください。

● (ADM, 48) Dynamic modification failed: child object <childobject> belongs to a deleted application.

削除済みのクラスタアプリケーションに属するオブジェクト <childobject> を削除しようとするとこのメッセージが出力されます。これは、クラスタアプリケーションを削除すると、その子もすべて自動的に削除されるからです。

対処法 :

削除済みのクラスタアプリケーションに属するオブジェクトを削除しないようにしてください。

● (ADM, 49) Dynamic modification failed: deleted object <objectname> belongs to a deleted application.

削除済みのクラスタアプリケーションに属するオブジェクト <objectname> を削除しようとすると、このメッセージが出力されます。これは、クラスタアプリケーションを削除すると、その子もすべて (<objectname> を含む ) 削除されるためです。

対処法 :

オブジェクトを削除する前に、そのオブジェクトが削除中のクラスタアプリケーションに属していないことを確認してください。

● (ADM, 50) Dynamic modification failed: cannot delete object <object> since it is a descendant of a new object.

新規オブジェクトの子孫であるオブジェクト <object> を削除しようとすると、このメッセージが出力されます。動的変更が中止されます。

対処法 :

オブジェクトを削除するときに、それが新規オブジェクトの子孫でないことを確認してください。

● (ADM, 51) Dynamic modification failed: cannot link to child <childobject> since it will be deleted.

削除する予定の子 <childobject> にリンクしようとすると、このメッセージが出力され、動的変更が中止されます。

対処法 :

削除する予定の子オブジェクトにリンクしないようにしてください。

J2UZ-5294-06Z0(03) 93

Page 102: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

ADM: Admin キュー、コマンドキュー、およびディテクタキュー 付録 — 致命的でないエラーメッセージ

● (ADM, 52) Dynamic modification failed: cannot link to parent <parentobject> since it will be deleted as a result of deletion of object <object>.

オブジェクト <object> を削除して、その子孫 ( 親を削除したときに削除される ) を、RMS リソースグラフに追加する新規リソースの親として使用すると、このメッセージが出力され、動的変更が中止されます。

対処法 :

削除したオブジェクトの子孫を新規リソースの親として使用しないようにしてください。

● (ADM, 53) Dynamic modification failed: <node> is absent.

存在しないオブジェクト <object> の属性を変更しようとすると、このエラーが発生します。動的変更が中止されます。

対処法 :

既存のオブジェクトの属性を変更してください。

● (ADM, 54) Dynamic modification failed: NODE <object>, attribute <attribute> is invalid.

属性 <attribute> の値が無効なノード <object> を変更しようとすると、このメッセージが出力され、動的変更が中止されます。

対処法 :

属性 <attribute> の有効値を指定してください。

● (ADM, 55) Cannot create admin queue.

RMS はプロセス間通信用に Unix キューを内部で使用します。Admin キューは、RMS と他のユーティリティ (hvutil、hvmod、hvshut、hvswitch、hvdispなど ) の通信に使われるキューの1 つです。RMS がこのキューを作成できない場合は、RMS が終了コード 50で終了します。

対処法 :

RMS を再起動してください。

● (ADM, 57) hvdisp - open failed - filename.

-mオプションを指定して hvdispを呼び出したときに、RMS が/opt/SMAW/SMAWRrms/locks/.rms.<pid> ファイルを書込み用に開くことができないと、このメッセージが出力されます。

対処法 :

ディレクトリ /opt/SMAW/SMAWRrms/locks/.rms. が存在していること、およびファイルが作成できること ( 適切な権限、ファイルシステムの空き領域、空き i ノード ) を確認してください。これらの問題が 1 つでも存在する場合は、必要な管理操作によって問題を解決してください。これらの問題が存在しないにもかかわらず、エラーが発生する場合は、当社技術員(SE) に連絡してください。

94 J2UZ-5294-06Z0(03)

Page 103: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的でないエラーメッセージ ADM: Admin キュー、コマンドキュー、およびディテクタキュー

● (ADM, 58) hvdisp - open failed - filename : errormsg.

hvdispコマンドの実行中に、ファイル file(/opt/SMAW/SMAWRrms/locks/.rms.<pid>) を書込み用に開くことができないと、その理由 errormsg の書込みが行われます。

対処法 :

ディレクトリ /opt/SMAW/SMAWRrms/が存在していること、およびファイルが作成できること ( 適切な権限、ファイルシステムの空き領域、空き i ノード ) を確認してください。これらの問題が 1 つでも存在する場合は、必要な管理操作によって問題を解決してください。これらの問題が存在しないにもかかわらず、エラーが発生する場合は、当社技術員 (SE) に連絡してください。

● (ADM, 59) userapplication: modification is in progress, switch request skipped.

hvswitch、hvshutなどのコマンドはローカルでない hvmodコマンドと並列に実行できないため、このメッセージが switchlogに書込まれます。

対処法 :

hvswitchを実行する前に、userapplicationで hvmodが実行中でないことを確認してください。

● (ADM, 60) <resource> is not a userApplication object, switch request skipped!

切替えを実行するときは、hvswitchコマンドの引数としてクラスタアプリケーションを指定する必要があります。リソース <resource> がクラスタアプリケーションでない場合に、このメッセージが出力されます。

対処法 :

"PRIMECLUSTER 活用ガイド<コマンドリファレンス編> " で、hvswitchの正しい使用方法を確認してください。

● (ADM, 62) The attribute <ShutdownScript> may not be specified for object <object>.

ShutdownScript属性は SysNodeの非表示属性です。この値は RMS BM が自動定義します。ユーザが変更することはできません。

対処法 :

ShutdownScript属性に定義済みの値を変更しないようにしてください。

● (ADM, 63) System name <sysnode> is unknown.

このメッセージは、以下に示す状況で出力されます。

1. hvswitchで指定した SysNodeの名前が RMS 構成定義ファイルの一部でない ('hvswitch [-f] userapplication [sysnode]')。

2. hvshut -s sysnode で指定した SysNodeの名前 ( 例 : sysnode など ) が有効でない、つまり現在の RMS 構成定義ファイルの一部でない。

3. hvutil -ouで指定した SysNodeの名前が不明である ( 隠れたオプション )。

対処法 :

現在の RMS 構成定義ファイル ( 例 : configname.usなど ) の中で使用している SysNode名を指定してください。

J2UZ-5294-06Z0(03) 95

Page 104: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

ADM: Admin キュー、コマンドキュー、およびディテクタキュー 付録 — 致命的でないエラーメッセージ

● (ADM, 67) sysnode Cannot shut down.

hvshut -aを呼び出したときに、一部のノードが応答しないと、このメッセージが出力されます。

対処法 :

リモートノードにログインします。RMS がまだ稼動している場合は、hvutil -f<userapplication> を実行して、クラスタアプリケーションを停止します。この操作により正しく終了しない場合は、switchlogと <userapplication> ログを参照して、問題の原因を調べてください。すべてのクラスタアプリケーションが正しく停止したら、強制シャットダウンhvshut -fで RMS 自体をシャットダウンします。その後で RMS のサポートに問題を報告してください。

● (ADM, 70) NOT ready to shut down.

hvshut -aを呼び出したノード上でアプリケーションがビジー状態であるため、そのノードをまだシャットダウンできません。

対処法 :

実行中のアクション ( 切替え、動的再構成など ) が終了するのを待ってください。

● (ADM, 75) Dynamic modification failed: child <resource> of userApplication object <userapplication> has HostName attribute <hostname> common with other children of the same userApplication.

RMS 内部の整合性チェック機能で、RMS 構成定義ファイルに関する重大な問題が見つかると、このメッセージが出力されます。RMS 設定ウィザードで RMS 構成定義ファイルを設定した場合は、このメッセージが出力されません。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (ADM, 76) Modification of attribute <attribute> is not allowed within existing object <object>.

属性 <attribute> は定数で、RMS 構成定義ファイルでのみ設定可能です。

対処法 :

<object> 内で <attribute> を変更しないようにしてください。

● (ADM, 77) Dynamic modification failed: cannot delete object object since its state is currently being asserted.

アサートしているオブジェクトに対して動的変更を実行すると、このメッセージが switchlogに書込まれます。

対処法 :

アサートが終了してから変更を行ってください。

● (ADM, 78) Dynamic modification failed: PriorityList <prioritylist> does not include all the hosts where the application <userapplication> may become Online.Ensure that PriorityList contains all hosts from the HostName attribute of the application's children.

96 J2UZ-5294-06Z0(03)

Page 105: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的でないエラーメッセージ ADM: Admin キュー、コマンドキュー、およびディテクタキュー

<userapplication> の PriorityListに、アプリケーションの子の HostName属性のノード名がすべて含まれるように設定します。

対処法 :

PriorityList内でノード名が重複しないようにしてください。

● (ADM, 79) Dynamic modification failed: PriorityList <prioritylist> includes hosts where the application <userapplication> may never become Online. Ensure PriorityList contains only hosts from the HostName attributes of the application's children.

親 PriorityListの属性に含まれていないノード名が、1 つ以上の子の HostName属性で指定されています。

対処法 :

アプリケーション <userapplication>のPriorityListに、アプリケーションの子のHostName属性に記載されたノード名がすべて含まれるように設定します。PriorityList 内でノード名が重複しないようにしてください。

● (ADM, 81) Dynamic modification failed: application <userapplication> may not have more than <maxcontroller> parent controllers as specified in its attribute MaxControllers.

<userapplication> が、属性 MaxControllers (<maxcontroller>) で指定されている数より多くの親コントローラを使用すると、このメッセージが出力されて、動的変更が中止されます。

対処法 :

アプリケーションが使用する親コントローラの数を、MaxControllers 属性で指定されている数より少なくするか、MaxControllersを大きな値に変更してください。

● (ADM, 82) Dynamic modification failed: cannot delete type <object> unless its state is one of Unknown, Wait, Offline or Faulted.

SysNodeの状態が、Unknown、Offline、Wait、または Faultedの場合に、この SysNodeまたは SatNodeを実行中の RMS 構成から削除しようとすると、このメッセージが switchlogに書込まれます。

対処法 :

そのノード上で RMS をシャットダウンして、削除を実行してください。

● (ADM, 83) Dynamic modification failed: cannot delete SysNode <sysnode> since this RMS monitor is running on this SysNode.

動的変更の実行中に、ローカル SysNode <sysnode> を削除しようとしました。

対処法 :

動的変更に 'delete sysnode;' (sysnodeはローカルSysNode) が含まれないようにしてください。

● (ADM, 84) 64. Dynamic modification failed: cannot add SysNode <sysnode> since its name is not valid.

動的変更の一部で指定した名前 <sysnode> を、既知のノード名に解決できない場合に、このメッセージが switchlogに書込まれます。

対処法 :

ネットワークアドレスに有効なノード名を指定してください。

J2UZ-5294-06Z0(03) 97

Page 106: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

ADM: Admin キュー、コマンドキュー、およびディテクタキュー 付録 — 致命的でないエラーメッセージ

● (ADM, 85) Dynamic modification failed: timeout expired, timeout symbol is <symbol>.

動的変更の実行時間が長すぎると、このメッセージが出力されます。

対処法 :

ノード間のネットワーク接続が機能していることを確認してください。また、新規追加リソースのスクリプトの実行時間が長すぎないこと、または動的変更で追加する新規ノードが多すぎないこと、または変更ファイルが大きすぎたり複雑すぎたりしないことを確認してください。

● (ADM, 86) Dynamic modification failed: application <userapplication> cannot be deleted since it is controlled by the controller <controller>.

制御されるアプリケーション <userapplication> のコントローラ <controller> の Resource属性にアプリケーションの名前が残っている間は、そのアプリケーションを削除できません。

対処法 :

削除したアプリケーションの名前をコントローラの Resource 属性から削除するか、同じ名前の新規アプリケーションを追加するか、制御されるアプリケーションとともにコントローラを削除するか、コントローラの NullDetector 属性 を 1 に変更してください。

● (ADM, 87) Dynamic modification failed: only local attributes such as ScriptTimeout, DetectorStartScript, or MonitorOnly can be modified during local modification (hvmod -l).

このメッセージが出力されるのは、ローカル変更ではローカル属性の変更だけが認められているからです。

対処法 :

ローカルでない変更を行うか、別の属性を変更してください。

● (ADM, 88) Dynamic modification failed: attribute <attribute> is modified more than once for object <object>.

特定のオブジェクトの属性は同じ変更ファイル内で 1 回しか変更できません。オブジェクト<%object> の属性 <attribute> を 2 回以上変更すると、このメッセージが出力される場合があります。

対処法 :

各オブジェクトの属性を 1 回だけ変更してください。

● (ADM, 89) Dynamic modification failed: cannot rename existing object <sysnode> to <othersysnode> because either there is no object named <sysnode>, or another object with the name <othersysnode> already exists, or a new object with that name is being added, or the object is not a resource, or it is a SysNode, or it is a controlled application which state will not be compatible with its controller.

既存のノード <sysnode> を他のノード <othersysnode> に改名しようとした場合に、以下の条件のいずれかに当てはまるとこのメッセージが出力されます。<othersysnode> は有効なノード名でない<othersysnode> はすでにクラスタ内の他のノード名として使用されている<othersysnode> はリソースでない<othersysnode> は制御されるアプリケーションである

対処法 :

別の有効なノード名を選択してください。

98 J2UZ-5294-06Z0(03)

Page 107: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的でないエラーメッセージ ADM: Admin キュー、コマンドキュー、およびディテクタキュー

● (ADM, 90) Dynamic modification failed: cannot change attribute Resource of the controller object <controllerobject> from <oldresource> to <newresource> because some of <oldresource> are going to be deleted.

コントローラオブジェクトによってコントロールされ、削除される予定のリソースを変更しようとすると、このメッセージが表示されます。

対処法 :

削除されるアプリケーションがコントローラによって制御されていないことを確認してください。

● (ADM, 91) Dynamic modification failed: controller <controller> has its Resource attribute set to <resource>, but application named <userapplication> is going to be deleted.

ユーザがコントローラ <controller> でリソース <resource> をコントロールしようとしたが、そのリソースと関連するユーザアプリケーションが削除される予定の場合に、このメッセージが出力されます。

対処法 :

コントローラの Resource 属性が、削除されるアプリケーションと関連していないことを確認してください。

● (ADM, 95) Cannot retrieve information about command line used when starting RMS. Start on remote host must be skipped. Please start RMS manually on remote hosts.

'-a' オプションで RMS を起動して、内部エラーのためリモートノード上で RMS を起動できない場合に、このメッセージが出力されます。重大な内部エラーです。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。当面の回避策としては、再度操作を行うか、各ノードの RMS を手動で起動してください。

● (ADM, 96) Remote startup of RMS failed <startupcommand>. Reason: error_reason.

コマンド <startupcommand> が失敗したので、RMS をリモートノード上で起動できないときに、このメッセージが出力されます。

対処法 :

一部のノードにアクセスできないとき、またはネットワークがダウンしているときに、このエラーが発生します。

ネットワーク、リモート先のノードに問題が無いか確認し、原因を回避してから再度操作を行ってください。

● (ADM, 98) Dynamic modification failed: controller <controller> has its Resource attribute set to <resource>, but some of the controlled applications from this list do not exist.

コントローラノードがコントロールするアプリケーションが見つからず、そのアプリケーションがノード上で稼動しているときに、このメッセージが出力されます。

対処法 :

変更ファイルを訂正して、コントローラが既存のアプリケーションだけをコントロールするようにしてください。

J2UZ-5294-06Z0(03) 99

Page 108: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

ADM: Admin キュー、コマンドキュー、およびディテクタキュー 付録 — 致命的でないエラーメッセージ

● (ADM, 99) Dynamic modification failed: cannot change attribute Resource of the controller object <controller> from <oldresource> to <newresource> because one or more of the applications listed in <newresource> is not an existing application or its state is incompatible with the state of the controller, or because the list contains duplicate elements.

ユーザがコントローラ <controller> の Resource 属性を <oldresource> から <newresource> に変更しようとして、<newresource> にリストされている 1 つ以上のアプリケーションが既存のアプリケーションでない場合、またはアプリケーションの状態がコントローラの状態と矛盾する場合、またはリスト内の要素が重複している場合に、このメッセージが出力されます。

対処法 :

リソース <newresource> にリストされているアプリケーションが、2 回以上書かれていないことまたは無効であることを確認してください。

● (ADM, 100) Dynamic modification failed: because a controller <controller> has AutoRecover set to 1, its controlled application <userapplication> cannot have PreserveState set to 0 or AutoSwitchOver set to 1.

アプリケーションをコントローラでコントロールする必要があり、コントローラの AutoRecover 属性が 1 に設定されている場合は、アプリケーションの属性 PreserveState および AutoSwitchOver をそれぞれ 1 と 0 に設定する必要があります

対処法 :

アプリケーションの属性 PreserveStateおよび AutoSwitchOverを確認してください。

● (ADM, 106) The total number of SysNodes specified in the configuration for this cluster is hosts. This exceeds the maximum allowable number of SysNodes in a cluster which is maxhosts.

クラスタ内の SysNodeオブジェクト数の合計が、上限値を超えています。

対処法 :

クラスタ内の SysNodeオブジェクト数の合計がmaxhost を超えないように設定してください。

● (ADM, 107) The cumulative length of the SysNode names specified in the configuration for the userApplication <userapplication> is length. This exceeds the maximum allowable length which is maxlength.

userApplication <userapplication> の RMS 構成に指定された SysNode名の長さの累計が、上限値を超えています。

対処法 :

SysNode名の長さが、制限値以下になるように設定してください。

● (ADM, 118) Dynamic modification failed: cannot add SatNode <satnode> since its rKind <rkind> is not consistent with the rKind of the other SatNodes.

SatNode satnode の rkind が他の SatNodeの rkind と異なっています。

対処法 :

すべての SatNodeの rkind が同じであることを確認してください。

● (ADM, 125) Dynamic modification failed: The <attr> entry <value> for SysNode <sysnode> matches the <attr> entry or the SysNode name for another SysNode.

100 J2UZ-5294-06Z0(03)

Page 109: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的でないエラーメッセージ BAS: 起動および構成定義エラー

エントリ attr は一意でなければなりません。

対処法 :

エントリ attr が一意であることを確認してください。

● (ADM, 126) childapp: This application is controlled by controller <controller>. That controller is defined as a Local controller, so switching this application must be done by switching the controlling application <parentapp>.

Localコントローラに制御されたアプリケーションに対して hvswitchを使用しようとしました。 ローカルモードで制御されたアプリケーションは、制御元のアプリケーションの完全な制御下にあるため、hvswitch を単独で使用することはできません。

対処法 :

ローカルモードで制御されたアプリケーションを切替えるには、制御元のアプリケーションを切替える必要があります。

5.3 BAS: 起動および構成定義エラー

● (BAS, 2)Duplicate line in hvgdstartup.

RMS が hvgdstartupで行の重複を検出すると、このメッセージが表示されます。この後、RMS は終了コード 23で終了します。

対処法 :

hvgdstartupでは、行は一意である必要があります。重複した行はすべて削除してください。

● (BAS, 3)No kind specified in hvgdstartup.

hvgdstartupファイルで、ディテクタのエントリが gN -t<n> -k<n> の形式でない場合、または、-k<n>& オプションが脱落しています。この場合は RMS が起動できないため、コード 23で終了します。

対処法 :

ディテクタの種類 (-k<n> オプション ) が、正しく指定されるようにエントリを修正してください。

● (BAS, 6)DetectorStartScript for kind <kind> cannot be redefined while detector is running.

動的変更の間に DetectorStartScriptの種類を再定義しようとすると、このメッセージが出力されます。

対処法 :

ディテクタの実行中は DetectorStartScriptの再定義をしないようにしてください。

● (BAS, 9) ERROR IN CONFIGURATION FILE: message.

以下のいずれか 1 つのメッセージが表示されます。

1. Check for SanityCheckErrorPrint

2. Object <object> cannot have its HostName attribute set since it is not a child of any userApplication. Only the direct descendants of userApplication can have the HostName attribute set.

3. In basic.C:parentsCount(...)

J2UZ-5294-06Z0(03) 101

Page 110: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

BAS: 起動および構成定義エラー 付録 — 致命的でないエラーメッセージ

4. The node <node> belongs to more than one userApplication, app1 and app2. Nodes must be children of one and only one userApplication node.

5. The node <node> is a leaf node and this type <type> does not have a detector. Leaf nodes must have detectors.

6. The node <node> has an empty DeviceName attribute. This node uses a detector and therefore it needs a valid DeviceName attribute.

7. The rName is <rname>, its length length is larger than max length maxlength.

8. The DuplicateLineInHvgdstartup is <number>, so the hvgdstartup file has a duplicate line.

9. The NoKindSpecifiedForGdet is <number>, so no kind specified in hvgdstartup.

10. Failed to load a detector of kind <kind>.

11. The node <node> has an invalid rKind attribute. Nodes of type gResource must have a valid rKind attribute.

12. The node <node> has a ScriptTimeout value that is less than its detector report time. This will cause a script timeout error to be reported before the detector can report the state of the resource. Increase the ScriptTimeout value for objectname (currently value seconds) to be greater than the detector cycle time (currently value seconds).

13. Node <node> has no detector while all its children's "MonitorOnly" attributes are set to 1.

14. The node <node> has both attributes \"LieOffline\" and \"ClusterExclusive\" set. These attributes are incompatible; only one of them may be used.

15. The type of object <object> cannot be or and and at the same time.

16. Object <object> is of type and, its state is online, but not all children are online.

対処法 :

上記の説明を参照して構成を修正してください。

● (BAS, 14) ERROR:ERROR IN CONFIGURATION FILE:The object <object> belongs to more than one userApplication, userapplication1 and userapplication2. Objects must be children of one and only one userApplication object.

1 つのオブジェクトが複数のユーザアプリケーションの一部であることが判明しました。RMS アプリケーションは、共通オブジェクトを持つことができません。

対処法 :

複数のアプリケーションが共通のオブジェクトを持つことがないよう RMS 構成を見直してください。

● (BAS, 15)ERROR IN CONFIGURATION FILE:The object <object> is a leaf object and this type <type> does not have a detector. Leaf objects must have detectors.

102 J2UZ-5294-06Z0(03)

Page 111: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的でないエラーメッセージ BAS: 起動および構成定義エラー

子オブジェクトを持たないオブジェクト ( リーフオブジェクト ) のタイプは、type です。このタイプは、RMS のディテクタを持っていません。RMS 構成定義ファイルにおいては、すべてのリーフオブジェクトがディテクタを持つ必要があります。

対処法 :

すべてのリーフオブジェクトがディテクタを持つように RMS 構成定義ファイルを変更してください。

● (BAS, 16)ERROR IN CONFIGURATION FILE:The object object has an empty DeviceName attribute. This object uses a detector and therefore it needs a valid DeviceName attribute.

重大な内部エラーです。switchlogにこのメッセージが出力された場合は、BM に重大な障害が発生していることを示しています。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (BAS, 17)ERROR IN CONFIGURATION FILE:The rName is <rname>, its length length is larger than max length maxlength.

rName属性の値の長さが、上限値 maxlength を超えています。

対処法 :

上限値 maxlength を超えないよう rNameを指定してください。

● (BAS, 18)ERROR IN CONFIGURATION FILE:The duplicate line number is <linenumber>.

このメッセージには、hvgdstartup ファイルの重複行の行番号が表示されます。

対処法 :

ファイル hvgdstartup に重複行がないようにしてください。

● (BAS, 19)ERROR IN CONFIGURATION FILE:The NoKindSpecifiedForGdet is <kind>, so no kind specified in hvgdstartup.

hvgdstartupで汎用ディテクタの種類が指定されていません。

対処法 :

hvgdstartupの汎用ディテクタの種類を指定してください。

● (BAS, 23) ERROR IN CONFIGURATION FILE: DetectorStartScript for object object is not defined. Objects of type type should have a valid DetectorStartScript attribute.

オブジェクト object に DetectorStartScriptが定義されていません。

対処法 :

オブジェクト object に DetectorStartScriptが定義されていることを確認してください。

J2UZ-5294-06Z0(03) 103

Page 112: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

BAS: 起動および構成定義エラー 付録 — 致命的でないエラーメッセージ

● (BAS, 24) ERROR IN CONFIGURATION FILE: The object object has an invalid rKind attribute. Objects of type gResource must have a valid rKind attribute.

オブジェクト object に無効な rKind属性が指定されています。

対処法 :

オブジェクト object に有効な rKind属性を指定します。

● (BAS, 25)ERROR IN CONFIGURATION FILE:The object object has a ScriptTimeout value that is less than its detector report time. This will cause a script timeout error to be reported before the detector can report the state of the resource. Increase the ScriptTimeout value for object (currently seconds seconds) to be greater than the detector cycle time (currently detectorcycletime seconds).

ScriptTimeoutにディテクタの通知間隔より小さいと、このメッセージが表示されます。 この場合、リソースを Onlineまたは Offlineに変更しようとすると、その移行処理中はリソースに障害が発生しているように見えます。

対処法 :

ScriptTimeoutの値がディテクタ通知期間より大きくなるように変更してください。

● (BAS, 26)ERROR IN CONFIGURATION FILE:The type of object <object> cannot be 'or' and 'and' at the same time.

RMS オブジェクトは orまたは andのいずれかのタイプである必要がありますが、同時に両方のタイプであることはできません。switchlogにこのメッセージが出力された場合は、RMS の実行可能プログラムに重大な損傷が発生しています。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (BAS, 27)ERROR IN CONFIGURATION FILE:object <object> is of type 'and', its state is online, but not all children are online.

このメッセージは、動的変更の実行中に、変更の適用前に既存の RMS 構成を検証した際に表示されます。このメッセージが表示されると、動的構成はそれ以上実行されません。

対処法 :

タイプが andの Online オブジェクトすべてに、Online状態の子オブジェクトが存在するように修正した後、動的変更を実行してください。

● (BAS, 29)ERROR IN CONFIGURATION FILE:object <object> cannot have its HostName attribute set since it is not a child of any userApplication.

クラスタアプリケーションの子オブジェクトでないオブジェクトに、HostName属性が設定されています。HostName属性を設定できるのは、クラスタアプリケーションの子オブジェクトだけです。

対処法 :

オブジェクトの定義から HostName 属性を削除するか、このオブジェクトを他の非userApplication オブジェクトの子オブジェクトにすることにより、userApplicationオブジェクトをこのオブジェクトから切り離してください。

104 J2UZ-5294-06Z0(03)

Page 113: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的でないエラーメッセージ BAS: 起動および構成定義エラー

● (BAS, 30)ERROR IN CONFIGURATION FILE:The object object has both attributes "LieOffline" and "ClusterExclusive" set. These attributes are incompatible; only one of them may be used.

1 つの RMS オブジェクトに 2 つの属性 LieOfflineと ClusterExclusiveが同時に設定されています。1 つのオブジェクトには、どちらか一方しか指定できません。

対処法 :

RMS オブジェクト object から、いずれか一方または両方の属性を削除してください。

● (BAS, 31)ERROR IN CONFIGURATION FILE:Failed to load a detector of kind <kind>.

RMS BM によりディテクタが起動できませんでした。

対処法 :

ディテクタの実行可能ファイルが正しい場所に存在していること、および実行権限があることを確認してください。

● (BAS, 32)ERROR IN CONFIGURATION FILE:Object <object> has no detector while all its children's <MonitorOnly> attributes are set to 1.

ディテクタを持たないオブジェクトの、すべての子オブジェクトの MonitorOnly属性 が 1に設定されています。ディテクタを持たないオブジェクトには、MonitorOnlyが 0に設定された子オブジェクトが 低 1 つ必要です。

対処法 :

ディテクタを持たないオブジェクトには、MonitorOnlyが 0に設定された子オブジェクトが低 1 つ存在するように RMS 構成定義ファイルを変更してください。

● (BAS, 36)ERROR IN CONFIGURATION FILE: The Object object has both attributes "MonitorOnly" and "ClusterExclusive" set. These attributes are incompatible; only one of them may be used.

1 つの RMS オブジェクトに 2 つの属性 MonitorOnlyと ClusterExclusiveが同時に設定されています。 1 つのオブジェクトには、どちらか一方しか指定できません。

対処法 :

RMS オブジェクト object から、いずれか一方または両方の属性を削除してください。

● (BAS, 37) ERROR IN CONFIGURATION FILE: The satApplication <satapp> has no children, or its children are not valid resources.

satApplication satapp には子が存在しないか、satApplicationの子のいずれかが有効なリソースではありません。

対処法 :

satapp に有効なリソースである子が存在していることを確認してください。

● (BAS, 38) ERROR IN CONFIGURATION FILE: The satService <satserv> has no children, or its children are not valid resources.

satService satserv には子が存在しないか、satServiceの子のいずれかが有効なリソースではありません。

対処法 :

satserv に有効なリソースである子が存在していることを確認してください。

J2UZ-5294-06Z0(03) 105

Page 114: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

BAS: 起動および構成定義エラー 付録 — 致命的でないエラーメッセージ

● (BAS, 39) ERROR IN CONFIGURATION FILE: The gResource <gresource> belongs to a satellite configuration and it is not allowed to have any children.

gResource gresource は子を持つことができません。

対処法 :

gresource に子が存在しないことを確認してください。

● (BAS, 40) ERROR IN CONFIGURATION FILE: The object <object> belongs to more than one satApplication, satapplication1 and satapplication2. Objects must be children of one and only one satApplication object.

1 つのオブジェクトが複数の satApplication に関連付けられています。RMS satApplicationは、共通オブジェクトを持つことができません。

対処法 :

複数のアプリケーションが共通のオブジェクトを持つことがないよう構成を変更してください。

● (BAS, 41) ERROR IN CONFIGURATION FILE: The object <object> belongs to more than one satService, satservice1 and satservice2. Objects must be children of one and only one satService object.

1 つのオブジェクトが複数の satServiceに関連付けられています。RMS satServiceは、共通オブジェクトを持つことができません。

対処法 :

複数の satServiceが共通のオブジェクトを持つことがないよう構成を変更してください。

● (BAS, 42) ERROR IN CONFIGURATION FILE: The gResource <gresource> belonging to a satellite configuration does not have its HostName attribute set. Please ensure that the HostName attribute is set for this gResource.

gResource gresource に HostName属性が設定されていません。

対処法 :

サテライト構成に属する gResource gresource に HostName 属性が設定されていることを確認してください。

● (BAS, 43) ERROR IN CONFIGURATION FILE: The object object has both attributes "MonitorOnly" and "NonCritical" set. These attributes are incompatible; only one of them may be used.

1 つの RMS オブジェクトに 2 つの属性 MonitorOnlyと NonCriticalが同時に設定されています。 1 つのオブジェクトには、どちらか一方しか指定できません。

対処法 :

RMS オブジェクト <object> から、いずれか一方または両方の属性を削除します。

106 J2UZ-5294-06Z0(03)

Page 115: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的でないエラーメッセージ BM: BM ( ベースモニタ )

5.4 BM: BM ( ベースモニタ )

● (BM, 13) S4: no symbol for object <object> in .inp file, line = linenumber.

RMS 内部エラー。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (BM, 14) S6:Local queue is empty on read directive in line:linenumber.

RMS 内部エラー。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (BM, 15) S2: destination object <object> is absent in line: linenumber.

RMS 内部エラー。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (BM, 16) S2: sender object <object> is absent in line:linenumber.

RMS 内部エラー。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (BM, 17) Dynamic modification failed: line linenumber, cannot build an object of unknown type <symbol>.

動的変更の実行中に、タイプが不明のオブジェクトを追加しました。

対処法 :

RMS 構成定義ファイルでは、タイプが既知のオブジェクトだけを使用してください。

● (BM, 18) Dynamic modification failed: line linenumber, cannot set value for attribute <attribute> since object <object> does not exist.

存在しないオブジェクトの属性を変更することはできません。

対処法 :

存在するオブジェクトの属性だけを変更してください。

J2UZ-5294-06Z0(03) 107

Page 116: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

BM: BM ( ベースモニタ ) 付録 — 致命的でないエラーメッセージ

● (BM, 19) Dynamic modification failed: line linenumber, cannot modify attribute <attribute> of object <object> with value <value>.

属性変更の対象として、無効な属性を指定しました。

対処法 :

有効な属性だけを変更してください。

● (BM, 20) Dynamic modification failed: line linenumber, cannot build object <object> because its type <symbol> is not a user type.

動的変更の実行中に、システムタイプ <symbol> のオブジェクト <object> を指定しました。

対処法 :

新規オブジェクトを構成に追加するときは、有効なリソースタイプだけを使用してください。

● (BM, 21) Dynamic modification failed: cannot delete object <object> because its type <symbol> is not a user type.

システムタイプ <symbol> のオブジェクト <object> を、削除の対象として指定しました。

対処法 :

有効なリソースタイプのオブジェクトだけを削除してください。

● (BM, 23) Dynamic modification failed: The <Follow> attribute for controller <controller> is set to 1, but the content of a PriorityList of the controlled application <controlleduserApplication> is different from the content of the PriorityList of the application <userapplication> to which <controller> belongs.

制御されるアプリケーション <controlleduserApplication> の PriorityListが、コントローラ<controller> が属しているアプリケーション <userapplication> の PriorityListと異なる場合に、このメッセージが出力されます。

対処法 :

コントローラと制御されるアプリケーションの PriorityList が同じであることを確認してください。

● (BM, 24) Dynamic modification failed: some resource(s) supposed to come standby failed.

動的変更の実行中に、Standby状態のリソースに追加する新規リソースを Standbyにできない場合、このメッセージが出力されます。

対処法 :

RMS 構成定義ファイルを分析して、スタンバイ対応リソースを Standby状態にできるかどうか確認してください。

108 J2UZ-5294-06Z0(03)

Page 117: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的でないエラーメッセージ BM: BM ( ベースモニタ )

● (BM, 25) 82. Dynamic modification failed: standby capable controller <controller> cannot control application <userapplication> which has no standby capable resources on host <sysnode>.

アプリケーション <userapplication> をコントローラ <controller> で制御するには、アプリケーション <userapplication> がノード <sysnode> 上で 1 つ以上のスタンバイ対応リソースを持っている必要があります。

対処法 :

制御されるアプリケーションが 1 つ以上のスタンバイ対応コントローラを持っていること、またはコントローラがスタンバイ対応でないことを確認してください。

● (BM, 26) 83. Dynamic modification failed: controller <controller> cannot have attributes StandbyCapable and IgnoreStandbyRequest both set to 0.

コントローラの属性 StandbyCapableと IgnoreStandbyRequestの両方を 1に設定すると、このメッセージが出力されます。

対処法 :

属性を正しく設定して、再実行してください。

● (BM, 29) Dynamic modification failed: controller object <controller> cannot have its attribute 'Follow' set to 1 while one of OnlineTimeout or StandbyTimeout is not null.

コントローラノード <controller> の Follow属性を 1に設定するには、属性 OnlineTimeoutまたは StandbyTimeoutの一方を null にする必要があります。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員 (SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用 ガイド<トラブルシューティング編> " を参照してください。

● (BM, 42) Dynamic modification failed: application <userapplication> is not controlled by any controller, but has one of its attributes ControlledSwitch or ControlledShutdown set to 1.

アプリケーション <userapplication> をコントローラでコントロールする必要がある場合に、アプリケーションの属性 ControlledSwitchと ControlledShutdownの一方または両方が 1に設定されていると、このメッセージが出力されます。

対処法 :

属性を正しく設定して、再実行してください。

● (BM, 46) Dynamic modification failed: cannot modify a global attribute <attribute> locally on host <hostname>.

DetectorStartScript、NullDetector、または NonCritical などのグローバル属性 <attribute> を、ノード<hostname> 上でローカルに変更することはできません。

対処法 :

attribute をグローバルに変更するか、別の属性をローカルに変更してください。

J2UZ-5294-06Z0(03) 109

Page 118: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

BM: BM ( ベースモニタ ) 付録 — 致命的でないエラーメッセージ

● (BM, 54) The RMS-CF-CIP mapping cannot be determined for any host due to the CIP configuration file <configfilename> missing entries.Please verify all entries in <configfilename> are correct and that CF and CIP are fully configured.

CIP 構成定義ファイルに、エントリの抜けがあります。

対処法 :

クラスタ内で稼動するすべての RMS ノードのエントリが CIP 構成定義ファイルに含まれていることを確認してください。

● (BM, 59) Error errno while reading line <linenumber> of .dob file -- <errorreason>.

BM は、動的再構成の間に自らの RMS 構成を .dob ファイルから読込みを行います。このファイルが読込めない場合、このメッセージが switchlog に出力されます。この OS エラーは、errno および errorreason に表示されます。

対処法 :

ノードが .dobファイルをエラーが表示されることなく読込める状態にあることを確認してください。

● (BM, 68) Cannot get message queue parameters using sysdef, errno = <errno>, reason: <reason>.

メッセージキューパラメタの取得時に sysdefから BM にパラメタを送信できなくなりました。errno および reason の値はエラーの種類を示します。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (BM, 71) Dynamic modification failed: Controller <controller> has its attribute Follow set to 1. Therefore, its attribute IndependentSwitch must be set to 0, and its controlled application <application> must have attributes AutoSwitchOver == "No" StandbyTransitions="No" AutoStartUp=0 ControlledSwitch = 1 ControlledShutdown = 1 PartialCluster = 0. However, the real values are IndependentSwitch = <isw> AutoSwitchOver = <asw> StandbyTransitions = <str> AutoStartUp = <asu> ControlledSwitch = <csw> ControlledShutdown = <css> PartialCluster = <pcl>.

コントローラ属性 Followが設定されている場合、他の属性 IndependentSwitchover、AutoSwitchOver、ControlledSwitch、および ControlledShutdownの値は、それぞれ0、No、1、および 1に設定されている必要があります。 しかし、現在の構成定義ファイルはこのように設定されていません。

対処法 :

コントローラとそれにより制御されるユーザアプリケーションに対し、正しい組合せで属性を設定してください。

110 J2UZ-5294-06Z0(03)

Page 119: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的でないエラーメッセージ BM: BM ( ベースモニタ )

● (BM, 72) Dynamic modification failed: Controller <controller> with the <Follow> attribute set to 1 belongs to an application <application> which PersistentFault is <appfault>, while its controlled application <controlledapplication> has its PersistentFault <_fault>.

コントローラの Followが 1に指定された場合は、すべての制御されるアプリケーションは、属性 <PersistentFault> について、コントローラが属するアプリケーションと同じ値を持つ必要があります。

対処法 :

RMS 構成定義ファイルを確認後、修正してください。

● (BM, 73) The RMS-CF interface is inconsistent and will require operator intervention. The routine "routine" failed with error code errorcode - "errorreason".

これは、ルーチン routine が errorreason の理由で失敗し、RMS - CF の整合性が失われたことを示すメッセージです。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (BM, 74) The attribute DetectorStartScript and hvgdstartup file cannot be used together.The hvgdstartup file is for backward compatibility only and support for it may be withdrawn in future releases.Therefore it is recommended that only the attribute DetectorStartScript be used for setting new configurations.

DetectorStartScript属性と hvgdstartupファイルは排他関係にあります。

対処法 :

新しい RMS 構成の設定には必ず DetectorStartScript を使用してください。hvgdstartupは、将来のリリースではサポートされない可能性があります。

● (BM, 75) Dynamic modification failed: controller <controller> has its attributes SplitRequest, IgnoreOnlineRequest, and IgnoreOfflineRequest set to 1. If SplitRequest is set to 1, then at least one of IgnoreOfflineRequest or IgnoreOnlineRequest must be set to 0.

コントローラ属性の組合せが正しくありません。IgnoreOfflineRequestとIgnoreOnlineRequestの両方が 1に設定されていると、制御されるアプリケーションに要求がいっさい伝播されないため、要求は分割されません。

対処法 :

コントローラ属性を正しい組合せで指定してください。

● (BM, 80) Dynamic modification failed: controller <controller> belongs to the application <application> which AutoSwitchOver attribute has "ShutDown" option set, but its controlled application <controlled> has not.

制御するアプリケーションの AutoSwitchOver属性にオプション Shutdownが指定されている場合、このアプリケーションのコントローラにより制御されるすべてのアプリケーションにも、同様に AutoSwitchOver属性にオプション Shutdownが指定されている必要があります。

対処法 :

AutoSwitchOver属性を正しく設定してください。

J2UZ-5294-06Z0(03) 111

Page 120: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

BM: BM ( ベースモニタ ) 付録 — 致命的でないエラーメッセージ

● (BM, 81) Dynamic modification failed: local controller attributes such as NullDetector or MonitorOnly cannot be modified during local modification (hvmod -l).

NullDetectorや MonitorOnlyなどのローカルなコントローラ属性の変更は、グローバルな変更の間にのみ可能です。

対処法 :

ローカルでない変更を行うか、別の属性を変更してください。

● (BM, 90) Dynamic modification failed: The length of object name <object> is length. This is greater than the maximum allowable length name of maxlength.

オブジェクト名の長さが上限値を超えています。

対処法 :

オブジェクト名の長さが上限値を超えないようにしてください。

● (BM, 92) Dynamic modification failed: a non-empty value<value> is set to <ApplicationSequence> attribute of a nonscalable controller <controller>.

スケーラブルコントローラ以外のコントローラでは、ApplicationSequence属性は設定できません。

対処法 :

ApplicationSequence属性と Scalable属性を正しく設定してください。

● (BM, 94) Dynamic modification failed: the ApplicationSequence attribute of a scalable controller <controller> includes application name <hostname>, but this name is absent from the list of controlled applications set to the value of <resource> in the attribute <Resource>.

スケーラブルコントローラの ApplicationSequence属性に、制御されるアプリケーションのリストにないアプリケーション名が含まれています。

対処法 :

コントローラの ApplicationSequence属性と Resource属性を正しく設定してください。

● (BM, 96) Dynamic modification failed: a scalable controller <controller> has its attributes <Follow> set to 1 or <IndependentSwitch> set to 0.

スケーラブルコントローラでは、属性 Followを 0に、IndependentSwitchを 1に設定する必要があります。

対処法 :

Follow、IndependentSwitch、Scalableの各属性を正しく設定してください。

● (BM, 97) Dynamic modification failed: controller <controller> attribute <ApplicationSequence> is set to <applicationsequence> which refers to application(s) not present in the configuration.

スケーラブルコントローラの ApplicationSequence属性で指定できるのは既存のアプリケーションのみです。

対処法 :

ApplicationSequence属性を正しく設定してください。

112 J2UZ-5294-06Z0(03)

Page 121: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的でないエラーメッセージ BM: BM ( ベースモニタ )

● (BM, 98) Dynamic modification failed: two scalable controllers <controller1> and <controller2> control the same application <application>.

1つのアプリケーションを制御できるのは、1 つのスケーラブルコントローラのみです。

対処法 :

RMS 設定を修正してください。

● (BM, 99) Dynamic modification failed: controlled application <controlledapp> runs on host <hostname>, but it is controlled by a scalable controller <scontroller> which belongs to an application <controllingapp> that does not run on that host.

制御されるアプリケーションと制御するアプリケーションで、ノード名が一致していません。制御するアプリケーションは、制御されるアプリケーションが実行されているすべてのノードで実行されていなければなりません。

対処法 :

RMS 設定を修正してください。

● (BM, 101) Dynamic modification failed: controlled application <controlledapp> runs on host <hostname>, but it is controlled by a scalable controller <scontroller> which belongs to a controlling application <controllingapp> that does not allow for the controller to run on that host.

制御されるアプリケーションと制御するアプリケーションで、ノード名が一致していません。制御するアプリケーションは、制御されるアプリケーションが実行されているすべてのノードで実行されていなければなりません。

対処法 :

RMS 設定を修正してください。

● (BM, 103) Dynamic modification failed: Controller <controller> has its attribute Follow set to 1 and the controlled application <application> has StandbyCapable resources. Therefore the controller itself must have StandbyCapable set to 1 and IgnoreStandbyRequest must be set to 0.

コントローラに Follow属性が設定され、制御されるアプリケーションが StandbyCapableリソースを持つ場合、コントローラには StandbyCapableを設定し、IgnoreStandbyRequestを無効にしてください。無効になっていない場合、制御されるアプリケーションに Standby要求が正しく伝播されません。

対処法 :

コントローラとそれにより制御されるユーザアプリケーションに対し、正しい組合せで属性を設定してください。

● (BM, 105) Dynamic modification failed: Invalid kind of generic resource specified in DetectorStartScript <script> for object <object>.

ディテクタの起動スクリプト内の -kフラグに指定された値が正しくありません。

対処法 :

RMS 設定を修正してください。

J2UZ-5294-06Z0(03) 113

Page 122: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

BM: BM ( ベースモニタ ) 付録 — 致命的でないエラーメッセージ

● (BM, 106) The rKind attribute of object <object> does not match the value of the '-k' flag of its associated detector.

rKind属性の値とディテクタ起動行の -kフラグの値が一致していません。

対処法 :

RMS 設定を修正してください。

● (BM, 107) Illegal different values for rKind attribute in object <object>.

同一オブジェクト内で rKindの異なる値が検出されました。

対処法 :

RMS 設定を修正してください。

● (BM, 108) Dynamic modification failed: Scalable controller <object> cannot have its attribute <SplitRequest> set to 1.

コントローラ属性 Scalableと SplitRequestは同時に指定できません。

対処法 :

RMS 設定を修正してください。

● (BM, 109) Dynamic modification failed: Application <application> has its attribute PartialCluster set to 1 or is controlled, directly or indirectly, via a Follow controller that belongs to another application that has its attribute PartialCluster set to 1 -- this application <application> cannot have a cluster exclusive resource <resource>.

排他リソースは、PartialCluster属性が 1 に設定されたアプリケーションに属することはできません。また、排他リソースを PartialCluster属性が 1 に設定されたアプリケーションから Follow コントローラによって直接または間接的に制御することもできません。

対処法 :

RMS 設定を修正してください。

● (BM, 110) Dynamic modification failed: Application <application> is controlled by a scalable controller <controller>, therefore it cannot have its attribute <ControlledShutdown> set to 1 while its attribute <AutoSwitchOver> includes option <ShutDown>.

スケーラブルコントローラにより制御されたアプリケーションでは、AutoSwitchOverにオプション <ShutDown> が指定されている場合は、ControlledShutdownを 1 に設定することはできません。

対処法 :

RMS 構成を修正してください。

● (BM, 111) Dynamic modification failed: Line #line is too big.

構成設定ファイル内の 1 行の大きさが制限を超えています。

対処法 :

各行が 2000 バイト未満になるように、RMS 構成設定ファイルを修正してください。

114 J2UZ-5294-06Z0(03)

Page 123: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的でないエラーメッセージ CML: コマンドライン

● (BM, 113) Base monitor has reported 'Faulted' for host <Sysnode>.

ノード <Sysnode> に表記されたノードの RMS が予期しない終了したことを示します。

対処法 :

情報のメッセージのため、対処不要です。

● (BM, 114) Dynamic modification failed: The SatNode <satnode> specified is already an existing SysNode entry.

SatNode satnode はすでに SysNode名に使用されています。

対処法 :

SatNodeに別の名前を指定して、再度変更処理を行ってください。

● (BM, 122) getaddrinfo failed, reason: errorreason, errno <errno>. Failed to allocate a socket for "rmshb" port monitoring.

getaddrinfo が異常終了したため、rmshb のポートの割当てに失敗しました。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

5.5 CML: コマンドライン

● (CML, 11) Option (option) requires an operand.

hvcmのオプションには、引数を必要とするものがあります。引数を指定しないで hvcmを呼び出すと、このメッセージと hvcmの使用方法が表示され、RMS が終了コード 3で終了します。

対処法 :

"PRIMECLUSTER 活用ガイド<コマンドリファレンス編> " で、hvcm の正しい使用方法を確認してください。

● (CML, 12) Unrecognized option option.

無効なオプションを指定しました。

対処法 :

"PRIMECLUSTER 活用ガイド<コマンドリファレンス編> " で、hvcm の正しい使用方法を確認してください。

● (CML, 17) Incorrect range argument with -l option.

-lオプションで、不適切な数字を指定しました。範囲を確認してください。

対処法 :

"PRIMECLUSTER 活用ガイド<コマンドリファレンス編> " で、hvcm の -lオプションの範囲引数を確認してください。

J2UZ-5294-06Z0(03) 115

Page 124: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

CRT: コントラクトとコントラクトジョブ 付録 — 致命的でないエラーメッセージ

● (CML, 18) Log level <loglevel> is too large. The valid range is 1..maxloglevel with the -l option.

hvcmまたはhvutilの-lオプションで指定したログレベル loglevelが 大ログレベルmaxloglevelより大きい場合に、このメッセージが出力されて、RMS が終了コード 4で終了します。

対処法 :

hvcmまたは hvutilの -lオプションで、1..maxloglevel の範囲のログレベルを指定してください。

● (CML, 19) Invalid range <low - high>.Within the '-l' option, the end range value must be larger than the first one.

hvcmまたは hvutilの -lオプションでログレベルの範囲を指定し、上限 high の値が low の値より小さいと、このメッセージが出力されて、RMS が終了コード 4で終了します。

対処法 :

上限を下限より大きい値で指定してください。

● (CML, 20) Log level must be numeric.

hvcmまたは hvutilの -lオプションで指定したログレベルが数値でない場合に、このメッセージが出力されて、RMS が終了コード 4で終了します。

対処法 :

ログレベルを数値で指定してください。

● (CML, 21) 0 is an invalid range value. 0 implies all values. If a range is desired, the valid range is 1..maxloglevel with the -l option.

hvcm または hvutil の -l オプションでログレベルの範囲を指定し、範囲外の場合、このメッセージが出力されて、RMS が終了コード 4で終了します。

対処法 :

hvcm または hvutil の -l オプションに有効なログレベルを指定してください。有効範囲は1..maxloglevel です。

5.6 CRT: コントラクトとコントラクトジョブ

● (CRT, 1) FindNextHost: local host not found in priority list of nodename.

RMS BM はすべてのクラスタノードの優先順位リストを管理します。通常、ローカルノードは必ずリスト内に存在します。そうでない場合に、このメッセージが出力されます。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (CRT, 2) cannot obtain the NET_SEND_Q queue.

116 J2UZ-5294-06Z0(03)

Page 125: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的でないエラーメッセージ CTL: コントローラ

RMS は内部キューを使用して、同じノード上のプロセス間または異なるノード上のプロセス間でコントラクトを送信します(コントラクトはクラスタのノード間で送信され、特定の操作に関して異なるノードの同期がとられていることを確認するためのメッセージです)。これらのコントラクトを RMS クラスタのノード間で送信するために使用する NET_SEND_Q キューに問題があると、このメッセージが switchlog に書き込まれます。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (CRT, 3) Message send failed.

RMS がクラスタ内で別のノードにメッセージを送信しようとしたときに、NET_SEND_Qキューによるこのメッセージ配信が失敗すると、このメッセージが出力されます。原因として、メッセージ送信先のノードがダウンしているか、クラスタインタコネクトの問題が考えられます。

対処法 :

クラスタ内で他のすべてのノードが稼動していること、およびすべてのノードでネットワークの問題が発生していないことを確認してください。

● (CRT, 4) object: type Contract retransmit failed: Message Id = messageid see bmlog for contract details.

あるノード上の RMS が NET_SEND_Qキューを使用して、別のノードまたはそのノード自身に ( クラスタにノードが 1 つしか存在しない場合 ) コントラクトを送信するときは、内部で決められた特定の回数だけこのコントラクト送信を試みます。この回数が試行されてもメッセージを送信できない場合は、このメッセージが switchlogに書込まれて、このコントラクトが破棄されます (UAP コントラクトは破棄されません )。

対処法 :

クラスタインタコネクトに問題がないことと、クラスタの整合性がとれていること(つまり、複数のノード上でクラスタアプリケーションが Online でないこと、SysNode が保留 Wait 状態でないことなど)を確認してください。

確認した結果問題がある場合は、このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (CRT, 5) The contract <crtname> is being dropped because the local host <crthost> has found the host originator <otherhost> in state <state>. That host is expected to be in state Online. Please check the interhost communication channels and make sure that these hosts see each other Online.

ローカルノード crthost は、Onlineであるべきコントラクトノードの発信元の状態が、state であることを検出しました。

対処法 :

ノード間通信チャネルが正しく動作中であること、およびノードが互いに Onlineであることを認識していることを確認してください。

5.7 CTL: コントローラ

● (CTL, 1) Controller <controller> will not operate properly since its controlled resource <resource> is not in the configuration.

J2UZ-5294-06Z0(03) 117

Page 126: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

CUP: userApplication コントラクト 付録 — 致命的でないエラーメッセージ

コントローラによって制御されるリソースが RMS 構成に存在せず、コントローラのNullDetector属性が offに設定されている場合に、このメッセージが出力されます。

対処法 :

コントローラが正しく機能するには、制御されるリソースが RMS 構成内に存在する必要があります。リソースを正しく構成してください。

● (CTL, 2) Controller <controller> detected more than one controlled application Online. This has lead to the controller fault. Therefore, all the online controlled application will now be switched offline.

1 つ以上のノードで、コントローラ <controller> に制御されるアプリケーションが 2 つ以上Onlineになると、コントローラに障害が発生します。

対処法 :

コントローラに制御されるアプリケーションが、複数個 Onlineにならないようにしてください。

5.8 CUP: userApplication コントラクト

● (CUP, 2) object: cluster is in inconsistent conditioncurrent online host conflict, received: host, local: onlinenode.

どのノードがクラスタアプリケーションを制御するかについてクラスタノード間で合意に達しない場合に、このメッセージが出力されます。 も可能性の高い原因として、hvswitch要求の強制実行などのシステム管理者の操作ミスにより、複数ノードでクラスタアプリケーションが同時に Onlineになった場合が考えられます。

対処法 :

クラスタの不整合を分析して適切な解決策を実行してください。たとえば、複数ノードでクラスタアプリケーションが Onlineになった場合は、1 台のノードを除くすべてのクラスタアプリケーションを hvutil -fコマンドでシャットダウンしてください。

● (CUP, 3) object is already waiting for an event cannot set timer!

重大な内部エラーが発生しました。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (CUP, 5) object received unknown contract.

ノードが認識不能なコントラクトをアプリケーションから受け取りました。重大な内部エラーです。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

118 J2UZ-5294-06Z0(03)

Page 127: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的でないエラーメッセージ DET: ディテクタ

● (CUP, 7) userapplication is locally online, but is also online on another host.

ユーザアプリケーションがローカルノード上で Onlineで、現在のノード上でも Onlineです。

対処法 :

ユーザアプリケーションは 1 つのノードでのみ Onlineになることができます。1 つを除くすべてのノードでアプリケーションがOfflineであることを確認してください。アプリケーションが複数のノードで Onlineになっている場合は、hvutil -f を使用して余分なノード上のuserApplicationを Offline状態にしてください。

● (CUP, 8) object: could not get an agreement about the current online host; cluster may be in an inconsistent condition!

クラスタアプリケーションを制御するノードがどのノードなのかの認識がクラスタノード間で異なっている場合にこのメッセージが出力されます。 も可能性の高い原因として、hvswitch 要求の強制実行などのシステム管理者の操作ミスにより、複数ノードでクラスタアプリケーションが同時に Online になった場合が考えられます。

このメッセージは (CUP, 2) と同じです。(CUP, 8) がコントラクトの発信元ノードに出力されるのに対し、(CUP, 2) は発信元以外のノードに出力されます。

対処法 :

クラスタの不整合を分析して適切な解決策を実行してください。たとえば、複数ノードでクラスタアプリケーションが Onlineになった場合は、1 台のノードを除くすべてのクラスタアプリケーションを hvutil -fコマンドでシャットダウンしてください。

5.9 DET: ディテクタ

● (DET, 1) FAULT REASON: Resource <resource> transitioned to a Faulted state due to a child fault.

このメッセージは、依存するリソース (RMS グラフで下位にあるリソース ) に発生した障害が理由で、<resource> に示されるリソースに障害が発生したとき表示されます。

対処法 :

子リソースに障害が発生した原因を調べ、必要な修正を行ってください。

● (DET, 2) FAULT REASON: Resource <resource> transitioned to a Faulted state due to a detector report.

ディテクタから予期しない Faulted状態が通知されたときにこのメッセージが出力されます。

対処法 :

リソースに障害が発生した原因を調査し、適切な対処を実行してください。

● (DET, 3) FAULT REASON: Resource <resource> transitioned to a Faulted state due to a script failure.

このメッセージは、ディテクタがリソースのスクリプトの実行に失敗したときに表示されます。

対処法 :

スクリプトに誤りがないか確認し、さらにリソースにも問題がないか確認してください。

J2UZ-5294-06Z0(03) 119

Page 128: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

DET: ディテクタ 付録 — 致命的でないエラーメッセージ

● (DET, 4) FAULT REASON: Resource <resource> transitioned to a Faulted state due to a FaultScript failure.This is a double fault.

リソースに障害が発生したため FaultScriptを実行しましたが、<resource> に示されるリソースの FaultScriptの実行に失敗しました。

対処法 :

FaultScript を実行するきっかけとなった故障リソースに対し、故障原因を調査してください。また、FaultScript の実行に失敗した <resource> に示されるリソースに対し、FaultScriptの実行が失敗したことによるシステムへの影響を調査してください。リソースに障害が発生した原因、および、FaultScriptの実行に失敗したことによるシステムへの影響が判明しない場合は、調査資料を採取し、当社技術員 (SE) に連絡してください。調査資料の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (DET, 5) FAULT REASON: Resource <resource> transitioned to a Faulted state due to the resource failing to come Offline after running its OfflineScript (offlineScript).

Offlineスクリプトを実行すると、リソースは Offlineになります。ScriptTimeout属性に指定された時間 ( 秒 ) 内に状態が変更されない場合、または Offline以外の状態に変更された場合、リソースは Faultedの状態であると判断されます。

対処法 :

Offlineスクリプトを実行後にリソースがOffline状態に変更されることを確認してください。

● (DET, 6) FAULT REASON: Resource <resource> transitioned to a Faulted state due to the resource failing to come Online after running its OnlineScript (onlinescript).

Onlineスクリプトを実行すると、リソースは Onlineになります。ScriptTimeout属性に指定された時間 ( 秒 ) 内に状態が変更されない場合、または Online以外の状態に変更された場合、リソースは Faultedの状態であると判断されます。

対処法 :

Onlineスクリプトを実行後にリソースがOnline状態に変更されることを確認してください。

● (DET, 7) FAULT REASON: Resource <resource> transitioned to a Faulted state due to the resource unexpectedly becoming Offline.

このメッセージはリソースが不意に Offlineになったときに表示されます。ディテクタが BM への応答を停止すると、リソースに障害が発生したと判断されます。

対処法 :

<resource> に示されるリソースが不意に Offline 状態になった原因を調査してください。リソースが不意に Offline 状態になった原因が判明しない場合は、調査資料を採取し、当社技術員 (SE) に連絡してください。調査資料の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

120 J2UZ-5294-06Z0(03)

Page 129: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的でないエラーメッセージ DET: ディテクタ

● (DET, 11) DETECTOR STARTUP FAILED: Corrupted command line <commandline>.

このメッセージは、コマンド行に何も指定されていない場合、または無効な値が指定されている場合に表示されます。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (DET, 12) DETECTOR STARTUP FAILED <detector>. REASON: errorreason.

ディテクタ detector が errorreason が理由で起動しない場合、このメッセージが出力されます。理由 errorreason は次のいずれかです。

– ディテクタ detector が存在しない。

– ディテクタ detector に実行権限がない。

– ディテクタのプロセスを出力できない。

– BM が同時に生成するプロセス数が 128 より多い。

対処法 :

エラーの原因に応じて適切な対処法をとってください。

● (DET, 13) Failed to execute script <script>.

ディテクタスクリプトが不良であるか、フォーマットが誤っています。

対処法 :

ディテクタ起動スクリプトをチェックしてください。

● (DET, 24) FAULT REASON: Resource <resource> transitioned to a Faulted state due to the resource failing to come Standby after running its OnlineScript (onlinescript).

スタンバイ要求中に Onlineスクリプトを実行すると、リソースは Standbyになります。ScriptTimeout属性に指定された時間 ( 秒 ) 内に状態が変更されない場合、または Standbyか Online以外の状態に変更された場合、リソースは Faultedの状態であると判断されます。

対処法 :

スタンバイ要求中に Onlineスクリプトを実行後、リソースが Standbyまたは Online状態に変更されることを確認してください。

● (DET, 26) FAULT REASON: Resource <resource> transitioned to a Faulted state due to the resource failing to come Online.

このメッセージは、リソースを Faulted状態にする可能性のある Onlineスクリプトを実行した後、リソースが Onlineになれなかった場合に表示されます。

対処法 :

リソース resource が Online状態になれなかった原因を調べてください。

J2UZ-5294-06Z0(03) 121

Page 130: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

GEN: 汎用ディテクタ 付録 — 致命的でないエラーメッセージ

● (DET, 28) <object>: CalculateState() was invoked for a non-local object! This must never happen. Check for possible configuration errors!

状態エンジンの中で要求を処理しているときに、要求トークンまたは応答トークンがオブジェクトに配信されましたが、そのオブジェクトはローカルノードに対して定義されていません。重大な内部エラーです。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (DET, 33) DETECTOR STARTUP FAILED: Restart count exceeded.

ディテクタに異常があり所定回数以上、ディテクタを再起動しました。ディテクタの異常が考えられます。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (DET, 34) No heartbeat has been received from the detector with pid <pid>, <startupcommand>, during the last <seconds> seconds. The base monitor will send the process a SIGALRM to interrupt the detector if it is currently stalled waiting for the alarm.

RMS ディテクタが停止しないようにするため、各ディテクタは BM に対し定期的にハートビートメッセージを送信します。ハートビートが一定期間途絶えると、switchlogに本メッセージが出力されます。BM は失速したプロセスにアラームシグナルを送信して、ディテクタがメインループを適切に処理してください。メッセージには、BM がディテクタのハートビートを前回受信してからの経過時間が記載されています。この時間が 300 秒を超えていると BM は実行できません。BM は現在リアルタイムプロセスですが、メモリにはロックされません。このメッセージは bm プロセスがスワップアウトされ再度起動されることがなかった場合に出力されます。

対処法 :

truss(1) や strace(1) 等のシステムツールを使用して、BM とディテクタが稼動しているかを確認してください。ハートビートの中断期間がタイムアウト時間の 300 秒を大きく超える場合は、システムスワップが必要であるかメインメモリが不足している可能性があります。

5.10 GEN: 汎用ディテクタ

● (GEN, 1) Usage: command -t time_interval -k kind [-d]

<command> の起動方法が正しくありません。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

122 J2UZ-5294-06Z0(03)

Page 131: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的でないエラーメッセージ INI: init スクリプト

● (GEN, 2) Memory lock failed.

内部エラーです。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (GEN, 3) Cannot open command log file.

ログの記録に使用するファイル <command> ログのオープンに失敗しました。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (GEN, 4) failed to create mutex: directory

hvdisp、hvswitch、hvutilなどのさまざまな RMS コマンドは、ディレクトリ directory のロックファイルをシグナル処理のために使用します。これらのファイルは、これらのコマンドの終了後に削除されます。ロックディレクトリのファイルは、RMS の起動時にも削除されます。これらのファイルが何らかの理由で削除されないと、このメッセージが出力されます。RMS は終了コード 99で終了します。

対処法 :

ロックディレクトリ<directory>が存在するかどうか確認し、存在する場合は削除してください。

● (GEN, 5) command: failed to get information about RMS base monitor bm!

汎用ディテクタ <command> は、ベースモニタの情報を取得することができませんでした。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (GEN, 7) command: failed to lock virtual memory pages, errno = value, reason: reason.

汎用ディテクタ <command> は、仮想メモリページを物理メモリにロックできませんでした。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

5.11 INI: init スクリプト

● (INI, 1) Cannot open file dumpfile, errno = errno: explanation.

このメッセージは、エラーコード <errno>、<explanation> が原因でファイル <dumpfile> のオープンに失敗したときに表示されます。

対処法 :

<explanation> に従って問題を修正してください。

J2UZ-5294-06Z0(03) 123

Page 132: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

MIS: その他 付録 — 致命的でないエラーメッセージ

● (INI, 9) Cannot close file dumpfile, errno = errno: explanation.

このメッセージは、エラーコード <errno>、<explanation> が原因でファイル <dumpfile> のクローズに失敗したときに表示されます。

対処法 :

<explanation> に従って問題を修正してください。

5.12 MIS: その他

● (MIS, 1) No space for object.

内部エラーです。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

5.13 QUE: メッセージキュー

● (QUE, 13) RCP fail: filename is being copied.

ファイル名 filename のファイルをコピーしようとしたときに別のコピーが処理中である場合にこのメッセージが出力されます。

対処法 :

同じファイルのコピーを同時に複数作成しないように注意してください。

● (QUE, 14) RCP fail: fwrite errno errno.

クラスタノード間のファイル転送中に問題が発生しました。

対処法 :

errno に基づいて適切な措置をとってください。

5.14 SCR: スクリプト

● (SCR, 8) Invalid script termination for controller <controller>.

コントローラスクリプトが不適切または無効です。

対処法 :

コントローラスクリプトをチェックしてください。

● (SCR, 9) REASON: failed to execute script <script> with resource <resource>: errorreason.

ディテクタスクリプトが不良であるか、フォーマットが誤っています。

対処法 :

ディテクタスクリプトをチェックします。

124 J2UZ-5294-06Z0(03)

Page 133: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的でないエラーメッセージ SWT: 切替要求 (hvswitch コマンド )

● (SCR, 20) The attempt to shut down the cluster host host has failed: errorreason.

以下のいずれかの理由でクラスタノードを停止できない場合に、このメッセージが出力されます。

1. スクリプトが 0 以外の状態で終了した

2. 補足したシグナルのため、スクリプトが終了した

3. その他の不明な失敗

対処法 :

ノードの状態を確認し、スクリプトに対して必要な修正措置をとり、可能な場合は、ノードの状態を手動で修正し、必要に応じて適切な hvutil -{o, u}を発行してください。

● (SCR, 21) Failed to execute the script <script>, errno = <errno>, error reason: <errorreason>.

script が実行できない場合に、errorreason とともに出力されるメッセージです。

対処法 :

errorreason に基づいて適切な措置をとってください。

● (SCR, 26) The sdtool notification script has failed with status status after dynamic modification.

動的変更の後、現在の構成設定が変更されたことが、sdtoolによってシャットダウン機構に通知されます。sdtoolが異常終了した場合は、BM を終了する必要があります。

対処法 :

sdtoolおよびシャットダウン機構が正常に動作しているかを確認してください。

5.15 SWT: 切替要求 (hvswitch コマンド )

● (SWT, 4) object is online locally, but is also online on onlinenode.

オブジェクト object がローカルノードと onlinenode の両方で Online 状態になっている場合にこのメッセージが出力されます。

オブジェクト object で共用ディスクの制御を行っている場合、データ破壊が発生するおそれがあります。

対処法 :

オブジェクト object をクラスタ内の 1 ノードでのみ Online 状態にしてください。

● (SWT, 20) Could not remove host <hostname> from local priority list.

ノードがクラスタを離脱しているのに、内部優先順位リストから該当のエントリを削除できません。プログラムスタックおよびメモリ管理内部の問題です。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

J2UZ-5294-06Z0(03) 125

Page 134: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

SYS: SysNode オブジェクト 付録 — 致命的でないエラーメッセージ

● (SWT, 25) objectname: outstanding switch request of dead host was denied; cluster may be in an inconsistent condition!

切替要求の処理中にノードが動作しなくなりました。クラスタアプリケーションを制御するノードが途中まで進んでいた切替え処理を続けようとしましたが、他のノードが同意しません。これはクラスタの重大な不整合が起こっていることを意味しますが、本来発生すべきでないエラーです。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (SWT, 26) object: dead host <hostname> was holding an unknown lock. Lock will be skipped!

停止中のノード <hostname> が、新規ノードにとって不明なロックをかけている場合に、このメッセージが出力されます。

対処法 :

クラスタがクリーンアップするのを待ってください。

● (SWT, 45) hvshut aborted because of a busy uap <userapplication>.

アプリケーションがビジーであるために hvshut要求が中止されました。

対処法 :

アプリケーションがビジーな場合は RMS をシャットダウンしないようにしてください。アプリケーションが処理を終了してから RMS をシャットダウンしてください。

● (SWT, 46) hvshut aborted because modification is in progress.

動的変更の実行中であるために hvshut要求が中止されました。

対処法 :

動的変更の実行中は RMS を停止しないでください。RMS を停止するには、動的変更が終了するまでお待ちください。

5.16 SYS: SysNode オブジェクト

● (SYS, 1) Error on SysNode: object. It failed to send the kill success message to the cluster host: host.

クラスタノードが停止した場合、停止を要求したノードは稼動中のノードに成功メッセージを送信する必要があります。成功メッセージの送信が失敗すると、switchlogにこのメッセージが出力されます。

対処法 :

クラスタおよびネットワークがメッセージを送信できる状態になっていることを確認してください。

126 J2UZ-5294-06Z0(03)

Page 135: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的でないエラーメッセージ SYS: SysNode オブジェクト

● (SYS, 8) RMS failed to shut down the host host via a Shutdown Facility, no further kill functionality is available. The cluster is now hung. An operator intervention is required.

RMS がシャットダウン機構 (SF) に停止要求を送信して、強制停止の応答を受け取らないと、このメッセージが出力されます。

対処法 :

CF の状態が LEFTCLUSTER 状態の場合、LEFTCLUSTER 状態を回復してください。LEFTCLUSTER状態については、"PRIMECLUSTER Cluster Foundation 導入運用手引書 " を参照してください。

CF の状態が LEFTCLUSTER 状態でない場合、SysNode の状態を確認してください。

SysNode が Wait 状態の場合は、Wait 状態をクリアしてください。Wait 状態のクリアについては、"PRIMECLUSTER RMS 導入運用手引書 " を参照してください。

● (SYS, 13) Since this host <hostname> has been online for no more than time seconds, and due to the previous error, it will shut down now.

このノードのチェックサムがクラスタ内のノードのチェックサムと異なる場合に、このメッセージが出力されます ( これは考えられる理由の 1 つ )。

対処法 :

すべてのクラスタノードで RMS 構成定義ファイルをチェックし、すべてのノードで同じ RMS構成定義ファイルが稼動していることを確認してください。

● (SYS, 14) Neither automatic nor manual switchover will be possible on this host until <detector> detector will report offline or faulted.

あるノードが Offlineで他のノードが Onlineのクラスタで、異なる RMS 構成定義ファイルが稼動しているときに、このメッセージが出力されます。

対処法 :

1 つのクラスタ内で同じ構成を実行するか、異なるクラスタに共通のホストが存在しないようにしてください。

● (SYS, 15) The uname() system call returned with Error. RMS will be unable to verify the compliance of the RMS naming convention!

uname()システムコールで 0以外の値が戻ると、このメッセージが出力されます。

対処法 :

SysNode名が有効なことを確認し、必要に応じて RMS を再起動してください。

● (SYS, 17) The RMS internal SysNode name "sysnode" is ambiguous with the name "name". Please adjust names compliant with the RMS naming convention "SysNode = `uname -n`RMS"

RMS の命名規則 sysnodename_ = `uname -n`RMSでは、RMS コマンドで SysNodeを指定する必要があるときに、後ろの RMS が付く CF 名と付かない cf-name を使用できます。この規則では、ある SysNodeの名前が xxxRMS で、別の SysNodeの名前が xxx の場合、command xxx がxxxRMS および xxx の両方を指すという曖昧さが発生します。

対処法 :

RMS 命名規則に従った名前を使用してください。

J2UZ-5294-06Z0(03) 127

Page 136: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

SYS: SysNode オブジェクト 付録 — 致命的でないエラーメッセージ

● (SYS, 48) Remote host <hostname> replied the checksum <remotechecksum> which is different from the local checksum <localchecksum>. The sysnode of this host will not be brought online.

リモートノード <hostname> とローカルノードで異なる RMS 構成定義ファイルが稼動している場合、またはこれらのノードに異なる RMS パッケージがインストールされている場合に、このメッセージが出力されます。

対処法 :

すべてのノードで同じ RMS 構成定義ファイルが稼動していること、およびその RMS 構成定義ファイルがすべてのノードに配布されていることを確認してください。すべてのノードに同じRMS パッケージ ( 同じリリース ) がインストールされていることを確認してください。

● (SYS, 49) Since this host <hostname> has been online for more than time seconds, and due to the previous error, it will remain online, but neither automatic nor manual switchover will be possible on this host until <detector> detector will report offline or faulted.

このノードのチェックサムがクラスタ内のノードのチェックサムと異なる場合に、このメッセージが出力されます ( これは考えられる理由の 1 つ )。

対処法 :

すべてのクラスタノードで RMS 構成定義ファイルをチェックし、すべてのノードで同じ RMS構成定義ファイルが稼動していることを確認してください。

● (SYS, 50) Since this host <hostname> has been online for no more than time seconds, and due to the previous error, it will shut down now.

このノードのチェックサムがクラスタ内のノードのチェックサムと異なる場合に、このメッセージが出力されます ( これは考えられる理由の 1 つ )。

対処法 :

すべてのクラスタノードで RMS 構成定義ファイルをチェックし、すべてのノードで同じ RMS構成定義ファイルが稼動していることを確認してください。

● (SYS, 84) Request <hvshut -a> timed out. RMS will now terminate! Note: some cluster hosts may still be online!

hvshutコマンドがデフォルトのタイムアウトに達して、一部のノードがまだ稼動している場合に、このメッセージが出力されます。

対処法 :

すべてのノードでシャットダウンが終了するように、RELIANT_SHUT_MIN_WAITを大きい値に設定して、デフォルトタイマを調整してください。内部の問題がシャットダウン失敗の原因かどうか確認してください 。例えば、OfflineScript が失敗すると、クラスタアプリケーションが Offlineになりません。

● (SYS, 90) hostname internal WaitList addition failure! Cannot set timer for delayed detector report action!

システムエラー。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

128 J2UZ-5294-06Z0(03)

Page 137: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的でないエラーメッセージ UAP: userApplication オブジェクト

● (SYS, 93) The cluster host hostname is not in the Wait state. The hvutil command request failed!

'hvutil' コマンド (hvutil -oまたは -u) を発行したときに、クラスタノード <nodename> がWait状態でないと、このメッセージが出力されます。

対処法 :

ノードが Wait状態のときだけ hvutil -{o, u}を再発行するか、このコマンドを発行しないようにしてください。

● (SYS, 94) The last detector report for the cluster host hostname is not online. The hvutil command request failed!

コマンド (hvutil -o sysnode) を発行して SysNodeの Wait状態をクリアしても、SysNodeがWait状態の場合に、このメッセージが出力されます。この原因は、クラスタノード <hostname>に対する 後のディテクタレポートが Onlineでないことです。つまり、SysNodeの状態がOnlineからではなく他の状態から Wait状態に変化した可能性があります。

対処法 :

ノードが Online状態から Wait状態になったときだけ、hvutil -oを発行してください。

● (SYS, 97) Cannot access the NET_SEND_Q queue.

新しいノードが Onlineになると、クラスタ内の他のノードは新しいノードが -Cオプションで起動されているかどうかを確認します。Onlineになったノードは NET_SEND_Qキューにより必要な情報を他のノードに送信します。ノードが NET_SEND_Qキューにアクセスできない場合にこのメッセージが出力されます。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (SYS, 98) Message send failed in SendJoinOk.

新しいノードが Onlineになると、クラスタ内の他のノードは新しいノードが -Cオプションで起動されているかどうかを確認します。Onlineになったノードは NET_SEND_Qキューにより必要な情報を他のノードに送信します。ノードが他のノードに必要な情報を送信できない場合にこのメッセージが出力されます。

対処法 :

ネットワークに問題がないかどうかを確認してください。

● (SYS, 100) The value of the attribute <attr> specified for SysNode <sysnode> is <invalidvalue> which is invalid. Ensure that the entry for <attr> is resolvable to a valid address.

値 attr が、有効なネットワークアドレスへの名前解決に失敗しました。

対処法 :

attr に有効なインタフェースが指定されているかを確認してください。

5.17 UAP: userApplication オブジェクト

● (UAP, 1) Request to go online will not be granted for application <userapplication> since the host <sysnode> runs a different RMS configuration.

J2UZ-5294-06Z0(03) 129

Page 138: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

UAP: userApplication オブジェクト 付録 — 致命的でないエラーメッセージ

アプリケーション <userapplication> を Onlineにする要求が発行されたにもかかわらず、ノード<sysnode> が異なる RMS 構成定義ファイルを稼動している場合に、このメッセージが出力されます。

対処法 :

同じ RMS 構成定義ファイルが稼動していることを確認してください。

● (UAP, 5) object: cmp_Prio: list.

このメッセージは、優先順位リスト list に無効なエントリがある場合に出力されます。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (UAP, 6) Could not add new entry to priority list.

重大な内部エラーが発生しました。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (UAP, 7) Could not remove entries from priority list.

重大な内部エラーが発生しました。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (UAP, 8) object: cpy_Prio failed, source list corrupted.

PriorityListが空または壊れている場合に、このメッセージが出力されます。重大な内部エラーが発生しました。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (UAP, 9) object: Update of PriorityList failed, cluster may be in inconsistent condition.

内部リストにあるはずのコントラクトが存在しない場合にこのメッセージが出力されます。クラスタの状態が不整合である可能性があります。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (UAP, 15) sysnode: PrepareStandAloneContract() processing unknown contract.

130 J2UZ-5294-06Z0(03)

Page 139: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的でないエラーメッセージ UAP: userApplication オブジェクト

1 つのアプリケーション <sysnode> だけが Onlineで、サポートされていないコントラクトを処理する必要がある場合に、このメッセージが出力されます。重大な内部エラーが発生しました。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (UAP, 16) object::SendUAppLockContract: local host doesn't hold a lock -- Contract processing denied.

アプリケーション<userApplication>のコントラクトに対するロックを持たないローカルノードがコントラクトを処理すると、このメッセージが出力されます。重大な内部エラーが発生しました。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (UAP, 19) object::SendUAppLockContract: LOCK Contract cannot be sent.

LOCKコントラクトをネットワーク上で送信できない場合に、このメッセージが出力されます。

対処法 :

ネットワークがダウンしている可能性があります。ネットワークに問題がないかを確認してください。

● (UAP, 21) object::SendUAppUnLockContract: UNLOCK Contract cannot be sent.

UNLOCKコントラクトをネットワーク上で送信できない場合に、このメッセージが出力されます。

対処法 :

ネットワークがダウンしている可能性があります。ネットワークに問題がないかを確認してください。

● (UAP, 22) object unlock processing failed, cluster may be in an inconsistent condition!

ローカルノードが UNLOCKコントラクトを受信したが、コントラクトでコミットされたフォローアップ処理を実行できない場合に、このメッセージが出力されます。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (UAP, 23) object failed to process UNLOCK contract.

ネットワークまたはメモリの問題などが原因で、ノードが受信した UNLOCKコントラクトを伝播できない場合に、このメッセージが出力されます。

対処法 :

このメッセージが出力されるときは、問題の原因を示す追加の ERROR メッセージも必ず出力されます。適切な ERRORメッセージを参照してください。

● (UAP, 24) Deleting of local contractUAP object failed, cannot find object.

J2UZ-5294-06Z0(03) 131

Page 140: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

UAP: userApplication オブジェクト 付録 — 致命的でないエラーメッセージ

ローカルコントラクトオブジェクトがコントラクトを完了して、ローカルノードに送信したにもかかわらず、ローカルオブジェクトがそのコントラクトを見つけられない場合に、このメッセージが出力されます。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (UAP, 27) object received a DEACT contract in state: state.

リモートノード上のクラスタアプリケーションが DeAct状態であるにもかかわらず、ローカルクラスタアプリケーションが DeAct状態ではありません。発生すべきでないエラーです。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (UAP, 28) object failed to update the priority list.Cluster may be in an inconsistent state.

ローカルノードは、特定の処理に関する制限解除のコントラクトを受信したときに停止状態のノードがあることがわかると、優先順位リストを更新してその情報を反映させます。このとき更新処理が失敗すると、このメッセージが出力されます。プログラムスタックおよびメモリ管理内部の問題です。重大な内部エラーです。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (UAP, 29) object: contract data section is corrupted.

アプリケーションがコントラクトのデータ部分を読取ることができない場合に、このメッセージが出力されます。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (UAP, 32) object received unknown contract.

アプリケーションがコントラクト要求の種類をコードで判別できないため、コントラクトの制限を解除できない場合に、このメッセージが出力されます。重大な内部エラーが発生しました。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

132 J2UZ-5294-06Z0(03)

Page 141: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的でないエラーメッセージ UAP: userApplication オブジェクト

● (UAP, 33) object unknown task in list of outstanding contracts.

userApplicationオブジェクトが未解決コントラクトのリスト内でタスクを検出したにもかかわらず、このメッセージが出力されます。発生すべきでないエラーです。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (UAP, 35) object: inconsistency occurred. Any further switch request will be denied (except forced requests). Clear inconsistency before invoking further actions!

アプリケーションの状態が Offlineまたは Standbyで、一部のリソースが OnlineまたはFaultedの場合に、このメッセージが出力されます。

対処法 :

適切なコマンド ( 通常は hvutil -c) で、この不整合を解決してください。

● (UAP, 41) cannot open file filename. Last Online Host for userApplication cannot be stored into non-volatile device.

ファイルオープンエラー。

対処法 :

環境変数 RELIANT_PATHを確認してください。

● (UAP, 42) found incorrect entry in status file:>entry<

status_infoファイルに不適切なエントリがある場合に、このメッセージが出力されます。status_infoファイルを手動で編集しない限り、発生すべきでないエラーです。

対処法 :

status infoファイルに手動で編集した不適切なエントリがないか確認してください。不適切なエントリがない場合は、このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (UAP, 43) <object>: could not insert <host> into local priority list.

重大な内部エラーが発生しました。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に

連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブル

シューティング編> " を参照してください。

● (UAP, 44) <object>: could not remove <host> from local priority list.

重大な内部エラーが発生しました。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に

連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブル

シューティング編> " を参照してください。

J2UZ-5294-06Z0(03) 133

Page 142: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

US: us ファイル 付録 — 致命的でないエラーメッセージ

● (UAP, 45) <object>: could not remove <host> from priority list.

重大な内部エラーが発生しました。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に

連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブル

シューティング編> " を参照してください。

● (UAP, 51) Failed to execute the fcntl system call to flags the file descriptor flags for file filename: errno = <errornumber>: <errortext>.

エラーコード <errornumber> の <errortext> で説明された理由により、RMS は、ファイル<filename> のファイルディスクリプタフラグ <flags> に対する fcntl()システムコールを実行できません。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に

連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブル

シューティング編> " を参照してください。

5.18 US: us ファイル

● (US, 5) The cluster host hostname is no longer reachable!Please check the status of the host and the Ethernet connection.

あるクラスタノードが他のクラスタノード hostname にアクセスできない場合、つまり、このクラスタノードが他のノード hostname を障害ノードとして認識すると、このメッセージが出力されます。原因として、他のノード hostname がダウンしているか、クラスタインタコネクトの問題が考えられます。

対処法 :

ノード hostname が本当に停止しているかどうかを確認してください。停止していない場合は、ネットワーク接続に問題がないかどうか確認してください。

● (US, 6) RMS has died unexpectedly on the cluster host hostname!

ローカルノード上のディテクタは、ノード hostname の状態が Onlineから Offlineに変化したことを検出すると、このメッセージを switchlogに書込み、ノード hostname を停止しようとします。

対処法 :

ノード hostname の syslogを調べて、ノードが停止した理由を確認してください。

● (US, 31) FAULT REASON: Resource resource transitioned to a Faulted state due to a detector report.

ディテクタから予期しない Faulted状態が通知されたときにこのメッセージが出力されます。

対処法 :

リソースに障害が発生した原因を調査し、適切な対処を実行してください。

134 J2UZ-5294-06Z0(03)

Page 143: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的でないエラーメッセージ WLT: Wait リスト

5.19 WLT: Wait リスト

● (WLT, 1) FAULT REASON: Resource resource's script (scriptexecd) has exceeded the ScriptTimeout of timeout seconds.

リソースのディテクタスクリプトが ScriptTimeoutを超過しました。

対処法 :

リソースが故障していないか確認してください。リソースが故障している場合は、適切な対処を実行してください。

リソースが故障していない場合は、リソースの ScriptTimeout 属性に指定された値が、Online/Offline スクリプトの実行時間よりも長くなるように属性値を変更してください。

● (WLT, 3) Cluster host hostname's Shutdown Facility invoked via (script) has not finished in the last time seconds. An operator intervention is required!

ノード hostname を停止するシャットダウン機構がまだ終了していません。オペレータの介入が必要です。スクリプトが自動的に終了するか、Unix 'kill' コマンドでスクリプトを終了するまで、このメッセージが定期的 ( ノードの ScriptTimeout値と同じ間隔で ) に出力されます。スクリプトを killコマンドで終了すると、ノードが停止しないとみなされます。

対処法 :

スクリプトが終了するのを待ちます。スクリプトが自動的に終了しない場合は、'kill' コマンドでスクリプトを終了してください。

● (WLT, 5) CONTROLLER FAULT: Controller <object> has propagated <request> request to its controlled application(s) <applications>, but the request has not been completed within the period of <timeout> seconds.

コントローラは、制御されるアプリケーションに対し要求を伝播する際に、制御されるアプリケーションが要求を処理するのに十分な時間待機します。この時間内に要求が完了しなかった場合、コントローラは Fault状態になります。

対処法 :

コントローラや制御されるアプリケーションのスクリプトを修正するか、制御されるアプリケーションのリソースを修正してください。ユーザ定義のコントローラスクリプトについては、ScriptTimeout値を増やしてください。

● (WLT, 9) sdtool notification timed out after <timeout> seconds.

動的変更が完了した後、現在の構成設定が変更されたことが、sdtoolによってシャットダウン機構に通知されます。 この通知が、ローカル SysNodeの ScriptTimeout値で指定した時間内に完了しなかった場合は、BM を終了する必要があります。

対処法 :

sdtool およびシャットダウン機構が正常に動作しているかを確認してください。 必要に応じて ScriptTimeoutの値を大きくしてください。

5.20 WRP: ラッパ

ここで説明するメッセージは、RMSウィザードが無効な構成定義ファイルを作成したときに出力されます。

● (WRP, 1) Failed to set script to TS.

J2UZ-5294-06Z0(03) 135

Page 144: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

WRP: ラッパ 付録 — 致命的でないエラーメッセージ

スクリプトをタイムシェアリングプロセスに設定することができませんでした。

対処法 :

理由に基づいて適切な措置をとってください。

● (WRP, 2) Illegal flag for process wrapper creation.

重大な内部エラーが発生しました。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (WRP, 3) Failed to execv: command.

このメッセージは次の場合に出力されます。

1. RMS が command コマンドでディテクタプロセスを実行できないので、ディテクタを起動できない場合。

2. hvcm -aがすでに呼び出されていて、各クラスタノード上で RMS BM を command コマンドで起動できない場合。

3. RMS が command コマンドでスクリプトプロセスを実行できないので、スクリプトを開始できない場合。

RMS はこのメッセージが表示されたノードで停止し、エラー番号 errno を返します。エラー番号はオペレーティングシステムにより返される値です。

対処法 :

システムのマニュアルページを参照し、エラー番号 errno から問題の原因がわかるかどうかを確認してください。原因がわからない場合は、当社技術員 (SE) に連絡してください。

● (WRP, 4) Failed to create a process: command.

このメッセージは次の場合に出力されます。

1. RMS が command コマンドを実行するためのディテクタプロセスを作成できないので、ディテクタを起動できない場合。

2. hvcm -aがすでに呼び出されていて、command コマンドで各クラスタノード上の RMS BMを起動できない場合。

3. RMS が command コマンドでスクリプトプロセスを作成できないので、スクリプトを開始できない場合。

RMS はこのメッセージが表示されたノードで停止し、エラー番号 errno を返します。エラー番号はオペレーティングシステムにより返される値です。

対処法 :

システムのマニュアルページを参照し、エラー番号 errno から問題の原因がわかるかどうかを確認します。原因がわからない場合は、当社技術員 (SE) に連絡してください。

136 J2UZ-5294-06Z0(03)

Page 145: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的でないエラーメッセージ WRP: ラッパ

● (WRP, 5) No handler for this signal event <signal>.

シグナル signal に関連するシグナルハンドラが登録されていません。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (WRP, 6) Cannot find process (pid=processid) in the process wrappers.

重大な内部エラーが発生しました。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (WRP, 7) getservbyname failed for service name: servicename.

重大な内部エラーが発生しました。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (WRP, 8) gethostbyname failed for remote host: host.

重大な内部エラーが発生しました。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (WRP, 9) Socket open failed.

このメッセージは、RMS が通信用のデータグラムエンドポイントを作成できない場合に出力されます。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (WRP, 10) connect to server failed.

重大な内部エラーが発生しました。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

J2UZ-5294-06Z0(03) 137

Page 146: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

WRP: ラッパ 付録 — 致命的でないエラーメッセージ

● (WRP, 12) Failed to bind port to socket.

このエラーは、RMS が通信用のエンドポイントをバインドできない場合に発生します。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (WRP, 13) Cannot allocate memory, errno <errornumber> - errortext.

メモリの割当てに失敗しました。 <errornumber> <errortext> の形式で原因が表示されます。

対処法 :

クラスタノードに十分なメモリが搭載されていることを確認し、RMS を再起動します。

● (WRP, 14) No available slot to create a new host instance.

RMS の BM を起動すると、クラスタ内のすべてのノードに対する内部データ構造にスロットが作成されます。hvdet_nodeの起動時に、RMS は SysNodeオブジェクトを送信します。これらの SysNodeは、内部データ構造内で別々のスロットに挿入されます。SysNode名を挿入するスロット (16) の数が足りないと、このメッセージが出力されます。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (WRP, 15) gethostbyname(hostname): host name should be in /etc/hosts

SysNodeとして指定したノード名 hostname のエントリが /etc/hostsにないと、このメッセージが switchlogに出力されます。

対処法 :

ノード名 hostname を /etc/hosts内のエントリに訂正してください。

● (WRP, 16) No available slot for host hostname

クラスタインタフェース (64) 用のスロットが不足すると、このメッセージがノード名 hostnameとともに出力されます。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (WRP, 17) Size of integer or IP address is not 4-bytes

重大な内部エラーが発生しました。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

138 J2UZ-5294-06Z0(03)

Page 147: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的でないエラーメッセージ WRP: ラッパ

● (WRP, 18) Not enough memory in <processinfo>

重大な内部エラーが発生しました。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (WRP, 23) The child process <cmd> with pid <pid> could not be killed due to errno <errno>, reason: reason.

pid pid の子プロセスが reason の理由で停止できませんでした。

対処法 :

理由 reason に基づいて適切な措置をとってください。

● (WRP, 24) Unknown flag option set for 'killChild'.

killChildルーチンは KILL_CHILDフラグおよび DONTKILL_CHILDフラグのみを受け付けます。これ以外のオプションが指定されると、このメッセージが出力されます。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (WRP, 25) Child process <cmd> with pid <pid> has exceeded its timeout period. Will attempt to kill the child process.

子プロセス cmd のタイムアウト時間が経過しました。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (WRP, 28) RMS monitor has encountered an irregular sequence of timer interrupts, off by <offset> seconds. This may have been caused by a manual OS time change, or by an unusually high OS performance load, or by some other OS condition. If this error appears frequently, then normal RMS operations can no longer be guaranteed; it can also lead to a loss of heartbeats with remote hosts and to an elimination of the current host from the cluster.

RMS モニタは、タイマ割り込みが毎秒規則的に発生しているかを監視します。 高負荷、手動による時間変更、その他の理由により割り込みが不規則になった場合は、上記の通知が表示されます。 値の不一致が大きくなった場合や、エラーが頻繁に発生するようになった場合は、RMS モニタの誤動作につながり、高可用性が損なわれる可能性があります。

対処法 :

RMS の動作中は、システムの日付や時間を大幅に変更しないでください。

ノード間で時刻が一致していることを確認してください。一致していない場合は、ノード間の時刻を一致させてください。

J2UZ-5294-06Z0(03) 139

Page 148: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

WRP: ラッパ 付録 — 致命的でないエラーメッセージ

● (WRP, 29) RMS on the local host has received a message from host host, but the local host is unable to resolve the sending host`s address. This could be due to a misconfiguration. This message will be dropped. Further such messages will appear in the switchlog.

ローカルノード上の RMS がローカルノードで解決できないアドレスを持つノードからのメッセージを受信しました。

対処法 :

RMS 構成定義ファイルの誤りをチェックして、ローカルノードがリモートノードのアドレスを認識できるようしてください。

● (WRP, 30) RMS on the local host has received a message from host host, but the local host is unable to resolve the sending host`s address. This message will be dropped. Please check for any misconfiguration.

ローカルノード上のRMSがローカルノードで認識できないアドレスを持つノードhostからのメッセージを受信しました。

対処法 :

RMS 構成定義ファイルの誤りをチェックして、ローカルノードがリモートノード host のアドレスを認識できるようにしてください。

● (WRP, 31) RMS has received a message from host host with IP address receivedip. The local host has calculated the IP address of that host to be calcip. This may be due to a misconfiguration in /etc/hosts. Further such messages will appear in the switchlog.

ローカルノードが、IP アドレス receivedip を持つノードからのメッセージを受信しましたが、このアドレスがローカルで計算したこのノードの IP アドレスと異なっています。

対処法 :

RMS 構成定義ファイルの誤りがないか、/etc/hostsを確認してください。

● (WRP, 32) RMS has received a message from host host with IP address receivedip. The local host has calculated the IP address of that host to be calcip. This may be due to a misconfiguration in /etc/hosts.

ローカルノードが、IP アドレス receivedip を持つノード host からのメッセージを受信しましたが、このアドレスがローカルで計算したこのノードの IP アドレスと異なっています。このメッセージは、受信メッセージの数が 500 未満の場合は、switchlog に 25 ごとに表示されます。 そうでない場合、このメッセージは、250 ごとに表示されます。

対処法 :

RMS 構成定義ファイルの誤りがないか、/etc/hostsを確認してください。

● (WRP, 33) Error while creating a message queue with the key <id>, errno = <errno>, explanation: <explanation>.

メッセージキューの作成で、OS の状態に異常が発生しました。

対処法 :

スワップ領域およびパラメタ msgmax、msgmnb、msgmni、msgtql の値など、メッセージキューのメモリ割当てに影響を与える OS の状態を確認してください。 メッセージキューの大数が割当て済みでないかを確認します。

140 J2UZ-5294-06Z0(03)

Page 149: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的でないエラーメッセージ WRP: ラッパ

● (WRP, 34) Cluster host host is no longer in time sync with local node. Sane operation of RMS can no longer be guaranteed. Further out-of-sync messages will appear in the syslog.

ノード上の時刻がローカルノードの時刻と同期していません。

対処法 :

ノードの時刻とローカルノードの時刻を同期させます。

また、NTP サーバとネットワーク接続されているか、NTP の設定が正しく行われているかを確認してください。

● (WRP, 35) Cluster host host is no longer in time sync with local node. Sane operation of RMS can no longer be guaranteed.

クラスタノード上の時刻がローカルノードの時刻と大きく (25 秒超 ) 異なっています。

対処法 :

時刻を同期させてください。

また、NTP サーバとネットワーク接続されているか、NTP の設定が正しく行われているかを確認してください。

● (WRP, 52) The operation func failed with error code errorcode.

func の実行がエラーコード errorcode で失敗しました。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (WRP, 60) The elm heartbeat detects that the cluster host <hostname> has become offline.

ELM の状態取得が失敗しました。

対処法 :

<hostname> の BM が動作しているかどうか状態を確認してください。

● (WRP, 69) function failed, reason: errorreason, errno <errno>.

RMS の処理で内部異常が発生しました。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (WRP, 70) getaddrinfo(hostname): host name should be in /etc/hosts

<hostname> のエントリがホストネームデータベースファイル (/etc/hosts, /etc/inet/ipnodes) に存在しません。

対処法 :

ホストネームデータベースファイルに <hostname> に関する記載があるかを確認してください。

J2UZ-5294-06Z0(03) 141

Page 150: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

WRP: ラッパ 付録 — 致命的でないエラーメッセージ

● (WRP, 71) Both IPv4 and IPv6 addresses are assigned to <SysNode> in /etc/hosts.

<SysNode> に対し、IPv4アドレスと IPv6アドレスの両方がホストネームデータベースファイル (/etc/hosts, /etc/inet/ipnodes) に記述されています。

対処法 :

<SysNode> に対する IPアドレスの記述が、IPv4または IPv6のいずれか 1 つのみとなるように、ホストネームデータベースファイルを修正してください。

142 J2UZ-5294-06Z0(03)

Page 151: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

6 付録 — 致命的エラーメッセージ(Fatal error messages)

この章では、switchlog ファイルに現れる致命的な (fatal) RMS エラーメッセージについて詳しく説明します。ほとんどのメッセージには、問題の原因と対処方法が併記されています。ただし、メッセージそのものが問題の説明や対処方法を表すものである場合には説明はありません。

また一部のメッセージには、斜体 ( イタリック ) のテキストが含まれています。これらの斜体部分はプレースホルダーであり、エラーメッセージが出力される場合には、実際の値、名称、文字列に置き換えられます。

RMS エラーコードの説明

各メッセージのプリフィックスには、問題を検出した RMS コンポーネントを示すエラーコードとメッセージ番号が含まれています。このプリフィックスは、必要に応じて問題の診断にあたる当社技術員 (SE)に提供してください。以下にエラーコードとそれに関連するコンポーネントを示します。

ADC: Admin 構成

ADM: Admin キュー、コマンドキュー、およびディテクタキュー

BM: BM

CML: コマンドライン

CMM: 通信

CRT: コントラクトとコントラクトジョブ

DET: ディテクタ

INI: initスクリプト

MIS: その他

QUE: メッセージキュー

SCR: スクリプト

SYS: SysNode

UAP: userApplication

US: usファイル

WRP: ラッパ

J2UZ-5294-06Z0(03) 143

Page 152: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

ADC: Admin 構成 付録 — 致命的エラーメッセージ

6.1 ADC: Admin 構成

● (ADC, 16) Because some of the global environmental variables were not set up in hvenv file, RMS cannot startup. Shutting down.

RMS が正しく機能するには、すべての RMS グローバル環境変数 RELIANT_LOG_LIFE、RELIANT_SHUT_MIN_WAIT、HV_CHECKSUM_INTERVAL、HV_LOG_ACTION_THRESHOLD、HV_LOG_WARNING_THRESHOLD、HV_WAIT_CONFIG、および HV_RCSTARTを hvenvで設定する必要があります。未設定の RMS グローバル環境変数があると、RMS が終了コード 1で終了します。

対処法 :

すべての RMS 環境変数の値を hvenvで設定してください。

● (ADC, 21) Because some of the local environmental variables were not set up in hvenv file, RMS cannot startup. Shutting down.

一部の RMS ローカル環境変数を hvenv ファイルで設定してない場合に、このメッセージが出力されて、RMS が終了コード 1で終了します。

対処法 :

/opt/SMAW/SMAWRrms/bin/hvenv.local ファイルで、すべての RMS ローカル環境変数を適切な値に設定してあることを確認してください。

● (ADC, 69) RMS will not start up - previous errors opening file.

先行するエラーが動的起動に必要なファイルのオープンエラーだったため、BM は終了します。

対処法 :

ファイルの存在を確認してから、動的起動要求を再度行ってください。

● (ADC, 73) The environment variable <hvenv> has value <value> which is out of range.

環境変数 <hvenv> の値が許容される範囲を超えています。 BM は終了します。

対処法 :

環境変数に有効な値を指定して、RMS を再起動してください。

6.2 ADM: Admin、コマンド、ディテクタキュー

● (ADM, 1) cannot open admin queue

RMS はプロセス間通信で UNIX メッセージキューを使用します。adminキューは hvutilやhvswitchのようなユーティリティ間の通信に使われるキューの 1 つです。このキューを開くときに問題が発生すると、このメッセージが出力されて、RMS が終了コード 3で終了します。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

144 J2UZ-5294-06Z0(03)

Page 153: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的エラーメッセージ BM: ベースモニタ

● (ADM, 2) RMS will not start up - errors in configuration file

RMS は起動時に、動的変更を実行します。このフェーズで、RMS 構成定義ファイルにエラーが見つかると、RMS は終了コード 23で終了します。

対処法 :

switchlogに上記メッセージの前に出力されたメッセージに基づいて、RMS 構成定義ファイルにエラーがないことを確認してください。

6.3 BM: ベースモニタ

● (BM, 3) Usage: progname [-c config_file] [-m] [-h time] [-l level] [-n]

引数の抜けまたは不適切な使用が理由で、RMS が正しく起動しないと、このメッセージが引数とともに switchlog に書き込まれます。RMS は終了コード 3 で終了します。

対処法 :

適切な引数を指定して RMS を起動してください。

● (BM, 49) Failure calculating configuration checksum

動的再構成の実行中に、RMS は /usr/bin/sumを使用して構成チェックサムを計算します。この計算が失敗すると、このメッセージが出力されて、RMS が終了コード 52で終了します。

対処法 :

/usr/bin/sumが使用可能かどうかチェックしてください。

● (BM, 51) The RMS-CF interface is inconsistent and will require operator intervention. The routine "routine" failed with errno errno - "error_reason"

CF の設定中に、dlopenまたは dlsymのルーチン routine に問題があると、RMS は終了コード95または 94で終了します。error_reason はエラーの理由を示します。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (BM, 58) Not enough memory -- RMS cannot continue its operations and is shutting down

メモリ不足のため RMS の機能が停止する前に switchlogに書込まれる一般的なメッセージです。

対処法 :

以下のいずれかが考えられます。

● メモリ資源が不足している

● カーネルパラメタの設定に誤りがある

システム全体で必要となるメモリ資源の見積りを見直してください。PRIMECLUSTER の動作に必要なメモリ容量については、各製品に添付されている PRIMECLUSTER のインストールガイド を参照してください。

上記で解決しない場合は、"PRIMECLUSTER 導入運用手引書 " の " カーネルパラメタ・ワークシート " の説明を参照して、カーネルパラメタの設定が正しいことを確認してください。設定に誤りがあった場合は、設定変更後、システムを再起動します。

J2UZ-5294-06Z0(03) 145

Page 154: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

BM: ベースモニタ 付録 — 致命的エラーメッセージ

上記対処によってこのエラーを解決できない場合は、このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (BM, 67) An error occurred while writing out the RMS configuration after dynamic modification. RMS is shutting down.

動的変更が終了すると、現在の RMS 構成がファイル /var/tmp/config.usにダンプされます。ダンプに失敗すると、RMS は構成のチェックサムを再計算できないためにシャットダウンします。

対処法 :

RMS構成定義ファイルの書込みに失敗した原因がswitchlogに出力されている前のメッセージに記述されています。この説明に従ってノード環境を修正するか、当社技術員 (SE) に連絡してください。

● (BM, 69) Some of the OS message queue parameters msgmax= <msgmax>, msgmnb=<msgmnb>, msgmni=<msgmni>, msgtql=<msgtql> are below lower bounds <hvmsgmax>, <hvmsgmnb>, <hvmsgmni>, <hvmsgtql>. RMS is shutting down.

システム定義のメッセージキューパラメタの値が小さすぎるため、RMS が正常に動作できません。RMS は終了コード 28で終了します。

対処法 :

OS のメッセージキューパラメタを変更し、OS を起動しなおしてから RMS を再起動してください。

● (BM, 89) FATAL: The SysNode length is length. This is greater than the maximum allowable length of maxlength. RMS will now shut down.

SysNode名の長さが上限値を超えています。

対処法 :

SysNode名の長さが maxlength より小さくなるようにしてください。

● (BM, 116) The RMS-CF interface is inconsistent and will require operator intervention. The CF layer is not yet initialized.

CFが初期化されていないためにRMS-CFインタフェースが不整合であることを示す一般的なメッセージです。

対処法 :

CF が初期化された後に、BM を再起動してください。

● (BM, 117) The RMS-CIP interface state on the local node cannot be determined due to error in popen() -- errno = errornumber: errortext.

ローカルノードの ciptoolを呼び出す popen()がただしく実行できなかったため、RMS-CIP インタフェースの状態が判定できません。

対処法 :

popen()の問題を修正し、BM を再起動してください。

146 J2UZ-5294-06Z0(03)

Page 155: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的エラーメッセージ CML: コマンドライン

● (BM, 118) The RMS-CIP interface state on the local node is required to be "UP", the current state is state.

RMS を正しく起動するには、RMS-CIP インタフェースの状態が UPであることが必要です。

対処法 :

CF が正しく初期化された後、BM を再起動してください。

6.4 CML: コマンドライン

● (CML, 14) ###ERROR: Unable to find or Invalid configuration file.########CONFIGURATION MONITOR exits !!!!!######

RMS 用に指定した構成定義ファイルが存在しないと、RMS が終了コード 1で終了します。

または、クラスタアプリケーションに登録されてないリソースが残っている可能性があります。 あるいは、クラスタアプリケーションを作成していない可能性があります。

対処法 :

RMS 用に有効な構成定義ファイルを指定してください。

または、必要に応じて、該当するリソースをクラスタアプリケーションに登録するか、リソースを削除してください。 あるいは、クラスタアプリケーションを作成してください。クラスタアプリケーションの概要と作成方法については、"PRIMECLUSTER 導入運用手引書 " を参照してください。

6.5 CMM: 通信

● (CMM, 1) Error establishing outbound network communication

アウトバウンドネットワーク通信の作成時にエラーが発生すると、このメッセージが出力されて、RMS が終了コード 12で終了します。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (CMM, 2) Error establishing inbound network communication

インバウンドネットワーク通信の作成時にエラーが発生すると、このメッセージが出力されて、RMS が終了コード 12で終了します。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

6.6 CRT: コントラクトおよびコントラクトジョブ

● (CRT, 6) Fatal system error in RMS. RMS will shut down now. Please check the bmlog for SysNode information.

J2UZ-5294-06Z0(03) 147

Page 156: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

DET: ディテクタ 付録 — 致命的エラーメッセージ

RMS 内でシステムエラーが発生しました。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

6.7 DET: ディテクタ

● (DET, 8) Failed to create DET_REP_Q

RMS がディテクタと RMS 自身の通信に使用する UNIX メッセージキュー DET_REP_Qを作成できない場合に、このメッセージが出力されて、RMS が終了コード 12で終了します。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (DET, 9) Message send failed in detector request Q: queue

hvlogcleanの実行中に、ディテクタ要求キュー queue を使用して BM からディテクタに情報を送信します。この通信で問題が発生すると、このメッセージが出力されて、RMS が終了コード12で終了します。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (DET, 16) Cannot create gdet queue of kind gkind

各汎用ディテクタは、BM との通信に使用するメッセージキューを持っています。ディテクタ用に kind という種類のキューを作成するときに問題が発生すると、このメッセージが出力されて、RMS が終了コード 12で終了します。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (DET, 18) Error reading hvgdstartup file. Error message: errorreason.

RMS がディテクタと RMS 自身の通信に使用する UNIX メッセージキュー DET_REP_Qを作成できない場合に、このメッセージが出力されて、RMS が終了コード 12で終了します。このファイルを読取るときにエラーが発生すると、上記のメッセージがエラーの理由 errorreason とともに出力されます。RMS は終了コード 26で終了します。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

148 J2UZ-5294-06Z0(03)

Page 157: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的エラーメッセージ INI: init スクリプト

6.8 INI: init スクリプト

ここで説明するメッセージは、RMSウィザードが無効な構成定義ファイルを作成したときに出力されます。

● (INI, 4) InitScript does not have execute permission.

InitScriptは存在しますが、実行できません。

対処法 :

InitScriptを実行可能にしてください。

● (INI, 7) sysnode must be in your configuration file

ローカル SysNode sysnode が RMS 構成定義ファイルの一部でない場合に、このメッセージが出力されて、RMS が終了コード 23で終了します。

対処法 :

ローカル Sysnode sysnode が RMS 構成定義ファイルの一部であることを確認してください。

● (INI, 10) InitScript has not completed within the allocated time period of timeout seconds.

InitScriptが、割り当てられた実行時間の終了時に実行中でした。タイムアウト時間は、RMS環境変数 SCRIPTS_TIME_OUTに定義された値と 300のいずれか小さいほうの値です。

対処法 :

タイムアウト値を大きくするか、スクリプトの実行中にタイムアウトが発生する条件を修正してください。

● (INI, 11) InitScript failed to startup, errno errno, reason: reason.

InitScriptの起動中にエラーが発生しました。errno コード <errno> および理由 <reason> が、メッセージに表示されます。

対処法 :

起動が可能なように InitScript のノード条件を修正してください。

● (INI, 12) InitScript returned non-zero exit code exitcode.

InitScriptが、0以外の終了コード <exitcode> で完了しました 。

対処法 :

終了コード 0を返すように InitScriptのノード条件を修正するか、InitScriptそのものを修正してください。

● (INI, 13) InitScript has been stopped.

InitScriptが停止しました。

対処法 :

実行中に停止しないように InitScriptのノード条件を修正するか、InitScriptそのものを修正してください。

J2UZ-5294-06Z0(03) 149

Page 158: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

INI: init スクリプト 付録 — 致命的エラーメッセージ

● (INI, 14) InitScript has been abnormally terminated.

InitScript異常終了しました。

対処法 :

実行中に停止しないように InitScriptのノード条件を修正するか、InitScriptそのものを修正してください。

● (INI, 17) Controller controller refers to an unknown userApplication <userapplication>

RMS 構成定義ファイルに、不明な userApplicationを参照するコントローラ <controller> が含まれています。

対処法 :

RMS 構成定義ファイルを修正してください。 RMS 構成定義ファイルの作成には PCS のみを使用してください。

● (INI, 18) Configuration uses objects of type "controller" and of type "gController". These object types are mutually exclusive!

RMS 構成定義ファイルには、controllerオブジェクトと gControllerオブジェクトの両方が定義されています。 RMS 構成定義ファイルではどちらか一方のコントローラタイプしか使用できません。

対処法 :

どちらか 1 つのタイプのコントローラのみが使用されるように RMS 構成定義ファイルを修正してください。 RMS 構成定義ファイルの作成には PCS のみを使用してください。

● (INI, 19) userApplication <childapp> is simultaneously controlled by 2 gController objects <controller1> and <controller2>. This will result in unresolveable conflicts!

RMS 構成定義ファイルには、2 つのコントローラ <controller1> と <controller2> が定義されています。これらは同じ userApplication<childapp> を制御します。 userApplicationは、1 つの親コントローラしか持てません。

対処法 :

RMS 構成定義ファイルを修正してください。 RMS 構成定義ファイルの作成には PCS のみを使用してください。

● (INI, 20) Incorrect configuration of the gController object <controller>! The attributes "Resource" and "ControllerType" are mandatory.

RMS 構成定義ファイルの持つ gControllerオブジェクトでは、未定義の属性が 低 1 つ存在する必要があります。

対処法 :

RMS 構成定義ファイルを修正してください。 RMS 構成定義ファイルの作成には PCS のみを使用してください。

150 J2UZ-5294-06Z0(03)

Page 159: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的エラーメッセージ MIS: その他

● (INI, 21) Incorrect configuration of the gController object <controller>! It has the attribute Local set, but the host list for the controlled application <childapp> does not match the host list for the controlling application <parentapp>.

RMS 構成定義ファイルには、Local 属性セットを持つ gController オブジェクト <controller>が定義されています。 このため親 (制御する側 ) アプリケーションと子 (制御される側 ) アプリケーションが、同じノード上で動作できることが必要です。 ただし、それぞれの優先順位リストは異なります。

対処法 :

RMS 構成定義ファイルを修正してください。 RMS 構成定義ファイルの作成には PCS のみを使用してください。

6.9 MIS: その他

● (MIS, 4) The locks directory directory cannot be cleaned of all old locks files: at call, errno = errnonumber, error -- errortext.

hvdisp、hvswitch、hvdumpなどのさまざまな RMS コマンドは、ディレクトリ directory のロックファイルをシグナル処理のために使用します。これらのファイルは、これらのコマンドの終了後に削除されます。ロックディレクトリのファイルは、RMS の起動時にも削除されます。これらのファイルが何らかの理由で削除されないと、このメッセージが出力されます。RMS は終了コード 99で終了します。call は、クリーンアップがどの段階で失敗したかを示し、errornumber は OS のエラー番号の値で、errortext は OS によるエラー番号の説明です。

対処法 :

ロックディレクトリ directory が存在することを確認してください。

6.10 QUE: メッセージキュー

● (QUE, 1) Error status in ADMIN_Q

さまざまなユーティリティが ADMIN_Qを使用して BM と通信します。このキューに問題があると、このメッセージが出力されて、RMS が終了コード 3で終了します。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (QUE, 2) Read message failed in ADMIN_Q

RMS BM が、ユーティリティと RMS の通信に使われる ADMIN_Qのメッセージを抽出できない場合に、このメッセージが出力されます。RMS は終了コード 3で終了します。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

J2UZ-5294-06Z0(03) 151

Page 160: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

SCR: スクリプト 付録 — 致命的エラーメッセージ

● (QUE, 5) Network message read failed

ネットワーク上のメッセージ読取りが失敗すると、このメッセージが出力されて、RMS が終了コード 3で終了します。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (QUE, 6) Network problem occurred

メッセージ送信中にネットワークの問題が発生すると、このメッセージが出力されます。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (QUE, 11) Read message failed in DET_REP_Q

すべてのディテクタは DET_REP_Qキューを使用して RMS BM と通信します。このキューのメッセージを読取るときに問題が発生すると、このメッセージが出力されて、RMS が終了コード 15で終了します。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (QUE, 12) Error status in DET_REP_Q: status

さまざまなディテクタが状態を報告するのに使用する DET_REP_Qキューの問題を RMS BM が検出すると、このメッセージが出力されます。RMS は終了コード 15で終了します。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (QUE, 15) Error No errornumber : <errortext> in accessing the message queue.

メッセージキューの使用方法に誤りがあります。 エラー番号 <errornumber> の <errortext> のテキストにエラーの種類が表示されています。 メッセージキューは BM との通信に使用されます。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

6.11 SCR: スクリプト

● (SCR, 4) Failed to create a detector request queue for detector detector_name

152 J2UZ-5294-06Z0(03)

Page 161: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的エラーメッセージ SCR: スクリプト

ディテクタ detector_name のディテクタ要求キューを作成できない場合に、このメッセージが出力されて、RMS が終了コード 12で終了します。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (SCR, 5) REQUIRED PROCESS RESTART FAILED: Unable to restart detector. Shutting down RMS

ディテクタ detector を再起動できない場合に、このメッセージが出力されて、RMS が終了コード14で終了します。再起動は以下のいずれかの理由で失敗します。

– ディテクタを 1 分間以内に 3 回以上再起動する必要があった。

– RMS 内でメモリ割当てに問題があった。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (SCR, 10) InitScript did not run ok. RMS is being shut down

RMS は 初に InitScriptを実行します。InitScriptの値は hvenvの RMS 環境変数RELIANT_INITSCRIPTの値です。この InitScriptが何らかの理由で失敗すると (0 以外のコードで終了する、シグナルを取得するなど )、このメッセージが出力されて、RMS が終了コード 56で停止します。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (SCR, 12) incorrect initialization of RealDetReport; Shutting down RMS.

スクリプトはディテクタのレポートに基づいて実行されるため、Online、Offline、Faulted、Standby、NoReport以外の無効な状態がディテクタから通知されると、このメッセージが出力されて、RMS が終了コード 8で終了します。

対処法 :

ディテクタが、有効な Online、Offline、Faulted、Standby、NoReport のいずれかの状態だけを通知するようにしてください。

● (SCR, 13) ExecScript: Failed to exec script <script> for object <objectname>: errno errno

RMS が特定のオブジェクト <objectname> に対してスクリプト <script> を実行できない場合に、このエラーメッセージが出力されます。errno errno は、このスクリプトの実行が失敗した詳しい理由を示します。RMS は終了コード 8で終了します。

対処法 :

システムのマニュアルページで、errno errno を調べて、失敗の理由を判別してください。理由がわからない場合は、当社技術員 (SE) に連絡してください。

J2UZ-5294-06Z0(03) 153

Page 162: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

SYS: SysNode オブジェクト 付録 — 致命的エラーメッセージ

● (SCR, 28) Manual Mode request failed to add satellite node node to AS DEACTSAT list.

重大なエラーです。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (SCR, 29) Manual Mode request failed to remove satellite node node from AS DEACTSAT list.

重大なエラーです。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

6.12 SYS: SysNode オブジェクト

● (SYS, 33) The RMS cluster host <hostname> does not have a valid entry in the /etc/hosts file. The lookup function gethostbyname failed. Please change the name of the host to a valid /etc/hosts entry and then restart RMS.

ファイル /etc/hostsを検索してノード hostname に関する情報を取得する検索関数gethostbynameで有効なエントリが見つからない場合に、このメッセージが出力されて、RMSが終了コード 114で終了します。

対処法 :

ファイル /etc/hostsにノード hostname の有効なエントリがあることを確認して、RMS を再起動してください。

● (SYS, 52) SysNode sysnode: error creating necessary message queue NODE_REQ_Q...exiting.

NODE_REQ_Qの作成時に問題が発生すると、このメッセージが出力されて、RMS が終了コード12で終了します。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

6.13 UAP: userApplication オブジェクト

● (UAP, 36) object: double fault occurred, but Halt attribute is set. RMS will exit immediately in order to allow a failover!

154 J2UZ-5294-06Z0(03)

Page 163: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的エラーメッセージ US: us ファイル

オブジェクト object に対する Halt属性を設定するときに二重障害が発生すると、そのノード上で RMS が終了コード 96で終了します。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

6.14 US: us ファイル

● (US, 1) RMS will not start up - fatal errors in configuration file.

RMS の起動時に RMS 構成定義ファイルにエラーが発生し、起動に失敗しました。このエラーは通常、RMS 構成設定ファイルを手動で編集し送付した場合に発生します。

対処法 :

RMS 構成定義ファイルのエラーを修正してください。

● (US, 42) A State transition error occurred. See the next message for details.

RMS の状態変更中に状態変更エラーが発生しました。 エラーの詳細がメッセージの後に出力されます。

対処法 :

エラーの内容に応じて、対処を行ってください。対処が不明な場合は、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

6.15 WRP: ラッパ

● (WRP, 40) The length of the type name specified for the host host is <length> which is greater than the maximum allowable length <maxlength>. RMS will exit now.

インタコネクト名の長さが上限値を超えています。

対処法 :

インタコネクト名の長さが上限値 maxlength を超えないようにしてください。

インタコネクト名の長さを上限値 maxlength 以下の長さにしてクラスタシステムを再構築してください。

● (WRP, 44) Not enough slots left in the wrapper data structure to create new entries.

サポートノード数以上の構成で RMS を起動した場合、このエラーが発生することがあります。このエラーが発生すると、BM は終了します。

対処法 :

クラスタシステムを構築する際は、サポートされたノード数を超えないようにしてください。

● (WRP, 45) The SysNode to the CIP name mapping for <sysnode> has failed.

J2UZ-5294-06Z0(03) 155

Page 164: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

WRP: ラッパ 付録 — 致命的エラーメッセージ

sysnode の RMS-CF-CIP のマッピングが失敗しました。

対処法 :

/etc/cip.cfファイルに有効なエントリがあるか確認してください。

● (WRP, 46) The RMS-CF interface is inconsistent and will require operator intervention. The routine "routine" failed with error code errorcode - "errorreason".

これは、ルーチン routine が errorreason の理由で失敗し、RMS と CF 間の整合性が失われたことを示す一般的なメッセージです。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (WRP, 47) The RMS-CF-CIP mapping cannot be determined for any host as the CIP configuration file <configfilename> cannot be opened. Please verify that all the entries in <configfilename> are correct and that CF and CIP are fully configured.

CIP 構成定義ファイル configfilename を読込むことができませんでした。

対処法 :

構成定義ファイル configfilename が存在することを確認してください。

● (WRP, 48) The RMS-CF-CIP mapping cannot be determined for any host as the CIP configuration file <configfilename> has missing entries. Please verify that all the entries in <configfilename> are correct and that CF and CIP are fully configured.

CIP 構成定義ファイルに、エントリの抜けがあります。

対処法 :

クラスタ内で稼動するすべての RMS ノードのエントリが CIP 構成定義ファイルに含まれていることを確認してください。

● (WRP, 54) The heartbeat mode setting of <hbmode> is wrong. Cannot use ELM heartbeat method on non-CF cluster.

ELM ハートビートは、CF モードでないクラスタでは使用できません。

対処法 :

CF をインストールするか、HV_USE_ELM=0に設定して ELM モードを停止してください。

● (WRP, 55) The heartbeat mode setting of <hbmode> is wrong. The valid settings are '1' for ELM+UDP and '0' for UDP.

HV_USE_ELMの設定が無効です。

対処法 :

HV_USE_ELMを 0 または 1 に設定してください。

156 J2UZ-5294-06Z0(03)

Page 165: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 致命的エラーメッセージ WRP: ラッパ

● (WRP, 58) The ELM lock resource <resource> for the local host is being held by another node or application.

重大な内部エラーが発生しました。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (WRP, 64) The ELM heartbeat startup failure for the cluster host <hostname>.

ELM の状態取得が失敗しました。

対処法 :

ELM のエラーを修正するか、HV_USE_ELM=0に設定して UDP モードを使用してください。

● (WRP, 67) The RMS-CF-CIP mapping cannot be determined for any host as the CIP configuration file <configfilename> has missing entries. Please verify that all the entries in <configfilename> are correct and that CF and CIP are fully configured.

CIP 構成定義ファイルに、エントリの抜けがあります。

対処法 :

クラスタ内で稼動するすべての RMS ノードのエントリが CIP 構成定義ファイルに含まれていることを確認してください。

J2UZ-5294-06Z0(03) 157

Page 166: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

WRP: ラッパ 付録 — 致命的エラーメッセージ

158 J2UZ-5294-06Z0(03)

Page 167: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — コンソールエラーメッセージ コンソールメッセージ

7 付録 — コンソールエラーメッセージ

この章では、コンソールに現れる RMS エラーメッセージについて詳しく説明します。メッセージはアルファベット順に並べられています。ただし、置き換え文字列で始まるメッセージが 初に表示されています。ほとんどのメッセージには、問題の原因と対処方法が併記されています。ただし、メッセージそのものが問題の説明や対処方法を表すものである場合には説明はありません。

また一部のメッセージには、斜体 ( イタリック ) のテキストが含まれています。これらの斜体部分はプレースホルダーであり、エラーメッセージが出力される場合には、実際の値、名称、文字列に置き換えられます。

7.1 コンソールメッセージ

● command1 cannot get list of resources via <command2> from hvcm.

RMS ウィザードは hvmodを使用して動的変更を実行します。コマンド command2 の実行時に問題が発生すると、このメッセージが出力されて、hvmodが終了コード 15で終了します。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● command failed due to errors in <argument>.

hvmodを呼び出すと、hvmodは hvbuildを内部で使用します。hvbuildの実行時に問題が発生すると、このメッセージが出力されて、hvmodが中止され、終了コード 1で終了します。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● command: bad state: state.

指定可能な state 以外を用いて hvassert を実行すると、このメッセージが生成されて hvassert が終了コード 1 で終了します。

対処法 :

状態が hvassert に対して指定可能な state 状態かどうか確認してください。

● command: bad timeout: timeout.

hvassertコマンドで指定したタイムアウトが数字でない場合に、このメッセージが出力されて、コマンドが終了コード 1で終了します。

対処法 :

hvassertのタイムアウト値を数字で指定してください。

● command: cannot open file filename.

J2UZ-5294-06Z0(03) 159

Page 168: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

コンソールメッセージ 付録 — コンソールエラーメッセージ

hvsend は、RMS リソースグラフ内のオブジェクトにメッセージを送信するために使用されます。送信するメッセージの一覧は、ファイルから取得することができます。このファイルを開くことができなかった場合、hvsend コマンドは、上記のメッセージを出力して終了コード 8 で終了します。

対処法 :

ファイル filename が存在することを確認してください。

● command: could not create a pipe

コマンド command が書込み用に tty を開くことができない場合に、このメッセージが出力されて、コマンドが終了コード 7 で終了します。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● command: failed due to undefined variable: local_host.

hvsendコマンドは、RMS 環境変数 RELIANT_HOSTNAMEを検出できない場合に、このメッセージを出力して終了コード 7で終了します。

対処法 :

RELIANT_HOSTNAMEが定義されていることを確認してください。

● command: file already exists

ユーザが hvdisp -oを呼び出したときに、引数として指定した出力ファイルがすでに存在している場合に、このメッセージが出力されて、hvdispが終了コード 6で終了します。

対処法 :

存在しないファイル名を hvdisp -oの引数として指定してください。

● command: message queue is not ready yet!

コマンド command はメッセージキューを使用して RMS BM にメッセージを送信します。このメッセージキューが何らかの理由で使用できない場合に、このメッセージが出力されて、ユーティリティが終了コード 3で終了します。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● command: Must be super-user to issue this command

これは、コマンド command を実行するのに、システム管理者権限が必要であることを示すメッセージです。

対処法 :

コマンドを発行する前にシステム管理者権限があることを確認してください。

160 J2UZ-5294-06Z0(03)

Page 169: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — コンソールエラーメッセージ コンソールメッセージ

● command: RMS is not running

コマンド command を呼び出すと、そのコマンドは RMS が稼動しているかどうかを確認します。RMS が稼動していない場合は、このメッセージが出力されて、ユーティリティが終了コード 2で終了します。

対処法 :

異なるコマンドを呼び出す前に、RMS が稼動していることを確認してください。

● directory: cannot put message in queue

hvdisp、hvswitch、hvutil、hvdumpなどのさまざまな RMS コマンドは、ディレクトリdirectory のロックファイルをシグナル処理のために使用します。これらのファイルは、これらのコマンドの終了後に削除されます。ロックディレクトリのファイルは、RMS の起動時にも削除されます。これらのファイルが何らかの理由で削除されないと、このメッセージが出力されます。RMS が終了コード 99で終了します。

対処法 :

ロックディレクトリ directory が存在することを確認してください。

● resource is not in state state.

オブジェクト resource に対して hvassertを実行しようとしたときに、リソースの状態が state でないことがわかると、このメッセージが出力されて、hvassertが終了コード 1で終了します。

対処法 :

対処する必要はありません。

● resource is not in state-detail state state.

hvassertは、オブジェクト <resource> が状態詳細 <state> の状態にないことを検出しました。 hvassertは終了コード 1 で終了します。

対処法 :

対処する必要はありません。

● timestamp: NOTICE: User has been warned of 'hvshut -f' and has elected to proceed.

ユーザが hvshut -fを呼び出して、コマンドの続行を選択すると、それを確認するために、このメッセージが出力されます。

対処法 :

対処する必要はありません。

● <command> failed with exit code exitcode

-dオプションを使用しないで hvlogcleanユーティリティを呼び出すときは、このユーティリティがコマンド command を実行します。何らかの理由でこのコマンドを実行できない場合に、コマンドが終了コード exitcode を戻し、ユーティリティが終了コード 6で終了します。

対処法 :

終了コード exitcode に基づいて適切な措置をとってください。

● BEWARE: 'hvshut -f' may break the consistency of the cluster.No further action may be executed by RMS until thecluster consistency is re-established.This re-establishmentincludes restart of RMS on the shut down host.

J2UZ-5294-06Z0(03) 161

Page 170: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

コンソールメッセージ 付録 — コンソールエラーメッセージ

Do you wish to proceed?(yes = shut down RMS / no = leave RMS running).

hvshut -fの処理をこのまま実行するかを尋ねるメッセージです。実行する場合は yesを選択し、中止する場合は noを選択します。

対処法 :

メッセージに応答してください。hvshut -f を使用すると、データの整合性が失われたりデータが破損する場合があるので、注意してください。

● BEWARE: the hvreset command will result in a reinitialization of the graph of the specified userApplication. This affects basically the RMS state engine only. The re-initialization does not mean, that activities invoked by RMS so far will be made undone. Manual cleanup of halfway configured resources may be necessary. Do you wish to proceed?(yes = reset application graph / no = abort hvreset).

hvresetの処理をこのまま実行するかを尋ねるメッセージです。実行する場合は yesを選択し、中止する場合は noを選択します。

対処法 :

メッセージに応答してください。

● Can't open modification file.

-cオプションを使用して hvmodを呼び出すと、hvmodは一時ファイルを使用します。このファイルを書込み用に開くことができない場合、このメッセージが出力されて、hvmodが終了コード1で終了します。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● Cannot start RMS! BM is currently running.

RMS はすでにローカルノード上で実行されています。

対処法 :

現在実行しているバージョンの RMS を停止して、再起動してください。

● Change dest_object to node.

対処法 :

対処する必要はありません。

● Command aborted.

コマンドを実行しようとすると確認メッセージが表示される場合があります。コマンドを実行するかどうかの質問に no で応答すると、このメッセージが出力されてコマンドの実行は中止されます。

対処法 :

対処する必要はありません。

162 J2UZ-5294-06Z0(03)

Page 171: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — コンソールエラーメッセージ コンソールメッセージ

● Command timed out!

対処法 :

対処する必要はありません。

● Could not open localfile or could not create temporary file filename

hvrcpの実行中に、ローカルファイルを読込み用に開くことができない場合、または一時ファイル filename を書込み用に開くことができない場合に、このメッセージが出力されて、hvrcpが終了コード 7で終了します。

対処法 :

ローカルファイルに対する権限を調べて、読取り可能なファイルであることを確認してください。

● Could not restart RMS. RELIANT_PATH not set.

ディテクタは RMS を再起動するときに、RMS 環境変数 RELIANT_PATHの値をチェックします。この変数の値を判別できない場合に、このメッセージが出力されます。

対処法 :

RELIANT_PATHが適切な値に設定されていることを確認してください。

● Delay delay seconds.....

hvsendで指定した遅れ delay を秒で知らせる通知メッセージです。

対処法 :

対処する必要はありません。

● DISCLAIMER: The hvdump utility will collect the scripts, configuration files, log files and any core dumps. These will be shipped out to RMS support. If there are any proprietary files you do not want included, please exit now. Do you want to proceed? (yes = continue / no = quit)

hvdump -Eを実行するとこのメッセージが出力されます。

hvdumpコマンドは、スクリプト、RMS 構成定義ファイル、ログファイル、およびコアダンプの収集を行います。これらのファイルは RMS のサポートに提供されます。提供を望まない独自のファイルがある場合は、処理を中止してください。処理を続行しますか ? (yes = 続行 / no = 中止 )

上記の質問に対して yesを選択した場合にのみ、hvdump -Eは情報の収集を行います。

対処法 :

メッセージに応答してください。

● DISCLAIMER: The hvdump utility will now collect the necessary information. These will be shipped to RMS support.

これは hvdumpコマンドが情報の収集を開始するメッセージです。

対処法 :

対処する必要はありません。

J2UZ-5294-06Z0(03) 163

Page 172: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

コンソールメッセージ 付録 — コンソールエラーメッセージ

● Error becoming a real time process: errorreason

Solaris 上では RMS BM はリアルタイムプロセスとして動作します ( したがって、他のプロセスより優先度が高い )。errorreason が理由で BM がリアルタイムプロセスになることができないと、このメッセージが出力されます。

対処法 :

理由 errorreason に基づいて適切な措置をとってください。errorreason については、"PRIMECLUSTER Cluster Foundation 導入運用手引書 " を参照してください。

● Error setting up real time parameters: errorreason

RMS BM をリアルタイムプロセスとして実行するためのパラメタを設定するときに問題が発生すると、このメッセージが問題の理由 errorreason とともに出力されます。

対処法 :

理由 errorreason に基づいて適切な措置をとってください。errorreason については、"PRIMECLUSTER Cluster Foundation 導入運用手引書 " を参照してください。

● Error while starting up bm on the remote host <targethost>: errorreason

hvcm -s <targethost> によるリモートノード上の RMS の起動時にエラーが発生しました。

対処法 :

問題の理由に基づいて適切な措置をとり、hvcm -sを再発行してください。errorreason については、"PRIMECLUSTER Cluster Foundation 導入運用手引書 " を参照してください。

● Error while starting up local bm: errorreason

ローカル bm 起動中のエラー : errorreason

対処法 :

理由 errorreason に基づいて適切な措置をとってください。errorreason については、"PRIMECLUSTER Cluster Foundation 導入運用手引書 " を参照してください。

● Failed to dup a file descriptor.

環境の設定中に RMS がファイルディスクリプタの dup に失敗すると、このメッセージが出力されます。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● Failed to exec the hvenv file <hvenvfile>.

RMS は、hvenv環境変数ファイル hvenvfile の execに失敗しました。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

164 J2UZ-5294-06Z0(03)

Page 173: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — コンソールエラーメッセージ コンソールメッセージ

● Failed to open pipe.

通信パイプのオープンに失敗すると、このメッセージが出力されて、RMS が終了コード 1で終了します。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● FATAL ERROR Could not restart RMS. Restart count exceeded.

ディテクタは RMS を再起動しようとするときに、RMS の再起動が必要だった回数を履歴します。この回数が 3 回を超えると、このメッセージが出力されます。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● FATAL ERROR: Could not restart RMS. Restart script (script) does not exist.

スクリプト script が存在しないためにディテクタが RMS を再起動できない場合、このメッセージが出力されます。

対処法 :

スクリプト script が存在することを確認してください。

● FATAL ERROR: Could not restart RMS. Failed to recreate RMS restart count file.

ディテクタは RMS を再起動するときに、必要な情報をカウントファイルに書き出すことによって、RMS の再起動を必要とした回数を記録しています。このカウントファイルがオープンできない場合に、上記メッセージが出力されます。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● FATAL ERROR: RMS has failed to start!

クラスタアプリケーションが作成されていないため、RMS を起動できません。

対処法 :

クラスタアプリケーションを作成してください。

● File open failed (path): errorreason.

hvassertユーティリティが RMS BM と通信する際に使用するファイル path を開くことができない場合に、このメッセージが失敗の理由 errorreason とともに表示されて、hvassertが終了コード 5で終了します。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

J2UZ-5294-06Z0(03) 165

Page 174: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

コンソールメッセージ 付録 — コンソールエラーメッセージ

● File system of directory directory is full!

hvdumpユーティリティで使用するファイルシステムに空き容量がありません。

対処法 :

ファイルシステムのクリーンアップを行うか、hvdump -w <altdir> を使用して、Critical の状態にないファイルシステム内の別のディレクトリを指定します。

● Forced shut down on the local cluster host!

ディテクタは BM を再起動するときに、このメッセージを出力してから、再起動を開始します。

対処法 :

対処する必要はありません。

● Fork failed.

RMS がプロセスのフォークに失敗した場合にこのメッセージが出力されて、RMS が終了コード1で終了します。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● hvutil: Could not determine if RMS is running on <targethost>, errno exitcode

hvutil -A targethost が呼び出されると、このメッセージが表示されます。targethost 上で RMSが稼動中であるかどうかが、このコマンドで確認できなかったことを示しています。exitcode は、/usr/include/sys/errno.hの値を表しています。

対処法 :

exitcode の値に応じて対処してください。

● hvutil: Could not determine IP address of <targethost>

クラスタノード名が IP アドレスに解決できませんでした。

対処法 :

/etc/hostsファイルに、すべてのクラスタノードの targethost を追加します。

● hvutil: debug option must be a positive number for on, 0 for off.

ログレベルとして 0または 1以外の値を指定して hvutil -Lを呼び出すと、このメッセージが出力されて、終了コード 6で終了します。

対処法 :

このコマンドに対する有効なログレベル 0 または 1 を指定します。

● hvutil: Detector time period must be greater than minimumtime.

hvutil -tの引数として指定したディテクタ時間が minimumtime より小さい場合は、hvutilが中止され、終了コード 5で終了します。

対処法 :

minimumtime より大きい時間を指定して hvutilを呼び出してください。

● hvutil: Failed to allocate socket

166 J2UZ-5294-06Z0(03)

Page 175: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — コンソールエラーメッセージ コンソールメッセージ

リモートノードとの通信に使用するソケットの割当てに失敗しました。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● hvutil: Missing /etc/services entry for "rmshb"

/etc/servicesファイルで、RMS ハートビート用のエントリに抜けがあります。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● hvutil: Notify string is longer than mesglen bytes

通知文字列が長すぎます。

対処法 :

通知文字列を mesglen バイト以下にしてください。

● hvutil: Processing Manual Mode request (request) for satellite node node.

情報メッセージです。

対処法 :

対処する必要はありません。

● hvutil: RMS is not running on <targethost>

hvutil -A targethost が呼び出されると、このメッセージが表示されます。指定されたノード上で RMS が稼動中であることを示しています。

対処法 :

対処する必要はありません。

● hvutil: RMS is running on <targethost>

hvutil -A targethost が呼び出されると、このメッセージが表示されます。指定されたノード上で RMS が稼動中であることを示しています。

対処法 :

対処する必要はありません。

● hvutil: The resource <resource> does not have a detector associated with it

リソース resource には関連付けられたディテクタがありません。

対処法 :

ディテクタが関連付けられているリソースで hvutil -Nを実行してください。

● hvutil: The resource <resource> is not a valid resource

J2UZ-5294-06Z0(03) 167

Page 176: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

コンソールメッセージ 付録 — コンソールエラーメッセージ

リソース resource は、有効なリソースではありません。

対処法 :

ディテクタが関連付けられ、かつリソースグラフの一部であるリソースで hvutil -Nを実行してください。

● hvutil: time period of detector must be an integer.

hvutil -tの引数として指定したディテクタ時間が数字でない場合は、hvutilが中止され、終了コード 6で終了します。

対処法 :

ディテクタ時間が整数であることを確認してください。

● hvutil: Unable to open the notification file <path> due to reason: reason

hvutilは、reason の理由によりファイル path を開けませんでした。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● hvutil: Valid values are: 0 to turn off logging. Positive number 1-1024 to turn on logging and "display" to show current log level.

無効な引数を指定して hvutil -Lを起動すると、このメッセージが表示された後、終了コード6 で終了します。

対処法 :

そのコマンドで有効な引数を指定してください。

● Invalid delay.

hvsendで指定したメッセージ送信の遅延がゼロより小さいと、このメッセージが表示されます。

対処法 :

有効な値を指定してください。

● It may take few seconds to do Debug Information collection.

リソースグラフに関する情報をダンプ出力する hvdump コマンドが、その情報を収集している間にこのメッセージが出力されます。

対処法 :

対処する必要はありません。

● localfile filename does not exist or is not an ordinary file

hvrcpの引数として指定したローカルファイルが存在しない場合または通常のファイルでない場合は、hvrcpが終了コード 7で終了します。

対処法 :

ローカルファイルが存在し、通常のファイルであることを確認してください。

● Manual Mode request (request) failed for satellite node node.

168 J2UZ-5294-06Z0(03)

Page 177: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — コンソールエラーメッセージ コンソールメッセージ

重大なエラーです。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● Manual Mode request successfully processed for satellite node node.

情報メッセージです。

対処法 :

対処する必要はありません。

● Name of the modification file is too long.

-fオプションで引数として指定した変更ファイル名の長さ、または -cオプションで指定した変更ディレクティブが 113 文字より大きい場合に、このメッセージが出力されて、hvmodが終了コード 4で終了します。

対処法 :

-fオプションと -cオプションで指定した引数が長すぎないことを確認してください。

● NOTICE: User has been warned of 'hvshut -A' and has elected to proceed.

ユーザが 'hvshut -A' を起動した後、確認メッセージに答えて実行を指定すると、このメッセージが出力されます。

対処法 :

対処する必要はありません。

● NOTICE: User has been warned of 'hvshut -f -a' and has elected to proceed.

ユーザが hvshut -f -aの実行を選択すると、上記の確認メッセージが出力されます。

対処法 :

対処する必要はありません。

● NOTICE: User has been warned of 'hvshut -L' and has elected to proceed.

ユーザが hvshut - L を呼び出して、コマンドを続行しようとすると、hvshut - L の呼び出しを確認するために、このメッセージが出力されます。

対処法 :

対処する必要はありません。

● RELIANT_LOG_PATH is not defined

-dオプションを使用しないで hvlogcleanユーティリティを呼び出すときは、hvloginitスクリプトを取得するのに RMS 環境変数 RELIANT_LOG_PATHの値が必要です。この RMS 環境変数の値が見つからない場合に、上記のメッセージが出力されて、ユーティリティが終了コード6で終了します。

対処法 :

RMS 環境変数 RELIANT_LOG_PATH が未設定でなく、適切な値に設定されていることを確認してください。

J2UZ-5294-06Z0(03) 169

Page 178: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

コンソールメッセージ 付録 — コンソールエラーメッセージ

● RELIANT_PATH is not defined

-dオプションを使用しないで hvlogcleanユーティリティを呼び出すときは、hvloginitスクリプトを取得するのに RMS 環境変数 RELIANT_PATHの値が必要です。この RMS 環境変数の値が見つからない場合に、上記のメッセージが出力されて、ユーティリティが終了コード 6で終了します。

対処法 :

RELIANT_PATHが適切な値に設定されていることを確認してください。

● Reset of RMS has been aborted.

hvreset コマンドは、起動されると確認メッセージを表示します。このメッセージに yes で応答しなかった場合は、hvreset は実行を中止して上記のメッセージを出力します。

対処法 :

対処する必要はありません。

● RMS environment failure: The following required variable is not defined in RMS environment:

RMS が動作するために必要としている RMS 環境変数の 1 つが hvenvにありません。

対処法 :

重大なエラーです。hvenv.*ファイルの環境定義情報が正しいかどうかを確認してください。

● RMS has failed to start!didn't find a valid entry in the RMS default configuration file "configfilename"

RMS デフォルトの構成定義ファイルが存在するにもかかわらず、実行する RMS 構成を参照する有効なエントリがない場合に、このメッセージが出力されます。

対処法 :

デフォルトの RMS 構成定義ファイル名を RMS デフォルトの構成定義ファイルに入れるか、起動する構成の中に現在の構成名を入れてください。

● RMS has failed to start!hvcm has been invoked without specifying a configuration with the -c attribute, but with specifying other command line options. This may cause ambiguity and is therefore not possible. Please specify the entire commandline or use "hvcm" without further options to run the default configuration

-cオプションに対する引数がありません。 -cの次に他のコマンドラインオプションを指定してRMS を起動すると、このメッセージが出力されます。

対処法 :

hvcmに -cオプションを指定する場合、-c configname は、コマンド行の 後の引数として指定してください。デフォルトの構成を使用する場合は、引数を指定せずに hvcm を実行してRMS をローカルノードで起動し、hvcm -aを使用して全ノードの RMS を起動してください。

170 J2UZ-5294-06Z0(03)

Page 179: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — コンソールエラーメッセージ コンソールメッセージ

● RMS has failed to start!invalid entry in the RMS default configuration file "configfilename"

デフォルトの RMS 構成定義ファイルに無効なエントリがある場合は、RMS を起動できません。有効なエントリは、「1. configname」または「2. hvcm <options> -c <configname>」です。形式 2 のオプション指定について、詳細は "PRIMECLUSTER 活用ガイド<コマンドリファレンス編> " を参照してください。

対処法 :

RMS デフォルト構成定義ファイルに含まれる無効なエントリをすべて削除してください。詳細は "PRIMECLUSTER 活用ガイド<コマンドリファレンス編> " を参照してください。

● RMS has failed to start!multiple entries in the RMS default configuration file "configfilename"

デフォルトの RMS 構成定義ファイル config.usに複数のエントリがある場合は、RMS を起動できません。

対処法 :

デフォルトの RMS 構成定義ファイルに含まれるあいまいなエントリをすべて削除し、有効なRMS 構成を 1 つだけ残してください。

● RMS has failed to start!RELIANT_HOSTNAME is not defined in the RMS environment

環境変数 RELIANT_HOSTNAMEが正しく設定されていません。

対処法 :

環境変数 RELIANT_HOSTNAME が誤って "" ( 空文字列 ) に設定されていないこと、またはhvenv.localで明示的に未設定になっていないことを確認してください。

● RMS has failed to start!the number of arguments specified at the command line overrides the internal buffer of the RMS start utility

コマンドラインで指定した引数の数がバッファの容量 (= 30 コマンドライン引数 ) を超えると、このメッセージが出力されます。

対処法 :

"PRIMECLUSTER 活用ガイド<コマンドリファレンス編> " で、hvcm の正しい形式を確認してください。

● RMS has failed to start!the number of arguments specified at the RMS default configuration file "configfilename" overrides the internal buffer of the RMS start utility

デフォルトの RMS 構成定義ファイルを使用して RMS を起動する場合に、デフォルトの RMS 構成定義ファイルで指定されている引数の数が多すぎるためにこのメッセージが出力されます。

対処法 :

デフォルトの RMS 構成定義ファイルから不要な引数を削除してください。"PRIMECLUSTER活用ガイド<コマンドリファレンス編> " で、RMS を起動するのに必要な hvcm のオプションを確認してください。

● RMS has failed to start!

J2UZ-5294-06Z0(03) 171

Page 180: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

コンソールメッセージ 付録 — コンソールエラーメッセージ

the options "-a" and "-s" are incompatible and may not be specified both

-aオプションと -sオプションを同時に使用して RMS を起動すると、このメッセージが出力されます。

対処法 :

"PRIMECLUSTER 活用ガイド<コマンドリファレンス編> " で、hvcm の正しい形式を確認してください。

● rms is dead

hvrcpコマンドは、RMS BM が稼動しているかどうかを 10 秒おきにチェックします。RMS BMが稼動していない場合に、このメッセージが出力されて、hvrcpが終了コード 1で終了します。

対処法 :

RMS をノード上で稼動してください。

● RMS on node node could not be shutdown with hvshut -A.

hvshut -A でノードをシャットダウンできない場合に出力されます。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● Root access required to start hvcm

RMS を起動するには、システム管理者権限が必要です。

対処法 :

システム管理者権限で実行してください。

● Sending data to resource.

ログ機能が有効な場合は、データ <data> がオブジェクト <resource> に送信されている間に、このメッセージが表示されます。

対処法 :

対処する必要はありません。

● Shutdown of RMS has been aborted.

hvshut -L を実行すると、hvshut コマンドから確認を要求されます。no を指定すると hvshut -L は中止され、このメッセージが出力されます。

対処法 :

対処する必要はありません。

● Starting Reliant Monitor Services now

RMS の起動時にこのメッセージが出力されます。

対処法 :

対処する必要はありません。

● Starting RMS on remote host host now

172 J2UZ-5294-06Z0(03)

Page 181: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — コンソールエラーメッセージ コンソールメッセージ

RMS がリモートノード host で起動されるときにこのメッセージが出力されます。

対処法 :

対処する必要はありません。

● startup aborted per user request

-cオプションを指定して RMS を起動するときに、指定した RMS 構成定義ファイルがCONFIG.rmsのエントリと異なると、新しい RMS 構成定義ファイルをアクティブにするかどうかを尋ねる質問が表示されます。noで答えると、このメッセージが出力されます。

対処法 :

対処する必要はありません。

● The archive file is file

このメッセージは、hvdumpユーティリティがアーカイブファイルへの情報の書込みを完了したこと示しています。

対処法 :

対処する必要はありません。

● The command 'command' could not be executed

コマンド command の実行が失敗しました。

対処法 :

command が有効なコマンドであるかを確認してください。

● The command 'command' failed to reset uid information with errno 'errno' - 'errorreason'.

コマンド command は、有効な uid を設定しようとして失敗しました。

対処法 :

errno の値に応じて対処してください。

● The command 'command' failed to set the effective uid information with errno 'errno' - 'errorreason'.

コマンド command は、uid を設定しようとして失敗しました。

対処法 :

<errornumber> の値に応じて対処してください。 <errortext> の説明を参照してください。

● The command 'command' may not be executed on a node configured as a satellite node. Use Adaptive Services to perform the operation.

サテライトノード上のコマンド command の実行はサポートされていません。

対処法 :

AS (Adaptive Services) を使用して、操作してください。

● The command 'command' must be executed on a core node in a satellite configuration.

J2UZ-5294-06Z0(03) 173

Page 182: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

コンソールメッセージ 付録 — コンソールエラーメッセージ

コマンド command はサテライト構成ではコアノードで実行する必要があります。

対処法 :

コマンドをサテライト構成のコアノードから実行してください。

● The configuration file "nondefaultconfig" has been specified as option argument of the -c option, but the Wizard Tools activated configuration is "defaultconfig" (see defaultconfig). The base monitor will not be started. The desired configuration file must be re-activated by using PCS Wizard activation command.

デフォルトの RMS 構成定義ファイルに存在する構成とは異なる構成で RMS を起動しようとすると、このメッセージが出力されます。RMS Wizard Tools の hvwコマンドで構成を再度有効にしてデフォルトの RMS 構成定義ファイルを変更するか、-cオプションに適切なオプション引数を指定する必要があります。

対処法 :

RMS Wizard Tools で RMS 構成定義ファイルを有効にするか、-cオプションに適切なオプション引数を指定してデフォルト構成を修正してください。

● The file 'filename' could not be opened: errormsg

hvdumpの実行中に errormsg が原因でファイル filename がオープンできなかった場合にこのメッセージが出力され、hvdumpが終了コード 8で終了します。

対処法 :

errormsg に基づいて適切な措置をとってください。

● The length of return message from BM is illegal (actuallength actual expectedlength expected).

hvassertコマンドが BM から受け取る戻りメッセージの長さが、expectedlength ではなくactuallength の場合に、このメッセージが出力され、hvassertが終了コード 5で終了します。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● The system call systemcall could not be executed: errormsg

hvdumpの実行中に errormsg が原因でシステムコール systemcall が実行できなかった場合にこのメッセージが出力され、hvdumpが終了コード 7で終了します。

対処法 :

errormsg に基づいて適切な措置をとってください。

● The user has invoked the hvcm command with the -a flag on a host where RMS is already running, sending request to start all remaining hosts.

hvcmに -aフラグを指定して実行すると、クラスタ内の他のノードで RMS が起動します。

対処法 :

対処する必要はありません。

● timed out! Most likely rms on the remote host is dead.

174 J2UZ-5294-06Z0(03)

Page 183: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — コンソールエラーメッセージ コンソールメッセージ

hvrcpの実行中に、ローカルノード上の BM がリモートノード上の BM から応答を受け取らなかったために、コマンドがタイムアウトになる場合、 も疑われる原因に、リモートブート上のRMS が停止していることが挙げられます。

対処法 :

リモートノード上の RMS が稼動していることを確認してください。

● Too many asserted objects, maximum is the max.

maximum より多くのオブジェクトをアサートしようとすると、このメッセージが出力されます。

対処法 :

アサートするオブジェクトの個数を maximum より少なくしてください。

● Unable to access directory directory

このメッセージは hvdumpユーティリティが、圧縮ファイルの作成時にディレクトリ <directory>にアクセスできなかったことを示しています。

対処法 :

ディレクトリ <directory> が存在することとアクセス権が正しく設定されていることを確認してください。

● Unable to execute command: command

hvmodの実行中に、コマンド <command> が実行できないと、hvmodは終了コード 1 で終了します。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● Usage: hvassert [-h SysNode] [-q] -s resource_name resource_state | [-h SysNode] [-q] -w resource_name resource_state seconds | [-h SysNode] [-q] -d resource_name state_detail [seconds]

hvassert コマンドを正しい方法で呼び出さないと、このメッセージが出力されて、コマンドが終了コード 6 で終了します。

対処法 :

メッセージに示された使用方法に従ってください。

● Usage: hvcm [-V] [-a] [-s targethost] [-c config_file] [-m] [-h time] [-l level]

使用方法が誤っています。

対処法 :

"PRIMECLUSTER 活用ガイド<コマンドリファレンス編> " で、hvcm の正しい使用方法を確認してください。

● Usage: hvconfig -l | -o config_file

hvconfig コマンドを不適切な方法で使用すると、このメッセージが出力されて、コマンドが終了コード 6 で終了します。

対処法 :

コマンドを正しい方法で使用してください。

J2UZ-5294-06Z0(03) 175

Page 184: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

コンソールメッセージ 付録 — コンソールエラーメッセージ

● Usage: hvdisp {-a | -c | -h | -i | -l | -n | -S resource_name [-u | -c] | -z resource_name | -T resource_type [-u | -c] | -u | resource_name | ENV | ENVL} [-o out_file]

hvdisp コマンドを不適切な方法で使用すると、このメッセージが出力されて、コマンドが終了コード 6 で終了します。

対処法 :

コマンドを正しい方法で使用してください。

● Usage: hvdump {-g | -f out_file | -t wait_time | -w working_directory}

hvdump コマンドを不適切な方法で使用すると、このメッセージが出力されて、コマンドが終了コード 6 で終了します。

対処法 :

コマンドを正しい方法で使用してください。

● Usage: hvlogclean [-d]

hvlogclean コマンドを不適切な方法で使用すると、このメッセージが出力されて、コマンドが終了コード 6 で終了します。

対処法 :

コマンドを正しい方法で使用してください。

● Usage: hvreset [-t timeout] userApplication

hvreset コマンドを不適切な方法で使用すると、このメッセージが出力されて、コマンドが終了コード 2 で終了します。

対処法 :

コマンドを正しい方法で使用してください。

● Usage: hvshut {-f | -L [-q] | -a | -l [-q] | -s SysNode [-q] | -A}

hvshut の使用方法がメッセージに示される使用方法に反している場合は、hvshut コマンドが終了コード 6 で終了します。

対処法 :

メッセージに示された使用方法に従ってください。

● Usage: hvswitch [-f] userApplication [SysNode] | -p userApplication

hvswitch コマンドで不明なオプションを使用するか、hvswitch に対して 3 つ以上の引数を指定すると、hvswitch が終了コード 6 で終了します。

対処法 :

コマンドを正しい方法で使用してください。

● Usage: hvutil {-a | -d | -c | -s} userApplication | -f [-q] userApplication | {-t n | -N string } resource | -L{level | display} resource | {-o | -u} SysNode | -l {level | display} | -w | -W | -i {all | userApplication} | -r | -m {on|off|forceoff} userApplication | -M {on|off|forceoff} | {-C | -E} userApplication

このメッセージは、以下のいずれかの場合に出力されます。– 複数の引数を指定して hvutil -u呼び出した。終了コード 7。

176 J2UZ-5294-06Z0(03)

Page 185: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — コンソールエラーメッセージ コンソールメッセージ

– オプションまたは引数を指定しないで hvutilを呼び出した。終了コード 7。– 不正なオプションを指定して hvutilを呼び出した。終了コード 7。– 引数を指定しないで hvutil -iを呼び出した。終了コード 13。– 引数を指定して hvutil -rを呼び出した。終了コード 14。– 引数を指定して hvutil {-w | -W}を呼び出した。終了コード 9。– NoConfirmを唯一の引数として hvutil -nを呼び出した。終了コード 5。– on、off、または forceoff以外の引数を指定して hvutil {-m | -M}を呼び出した。終

了コード 16。– 引数を指定しないで hvutil -mを呼び出した。または、引数を指定して hvutil -Mを呼び

出した。終了コード 16。

対処法 :

hvutilを正しい方法で使用してください。

J2UZ-5294-06Z0(03) 177

Page 186: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

コンソールメッセージ 付録 — コンソールエラーメッセージ

178 J2UZ-5294-06Z0(03)

Page 187: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

8 付録 — 警告メッセージ

この章では、switchlog に現れる RMS Warning メッセージについて詳しく説明します。ほとんどのメッセージには、問題の原因と対処方法が併記されています。ただし、メッセージそのものが問題の説明や対処方法を表すものである場合には説明はありません。

また一部のメッセージには、斜体 ( イタリック ) のテキストが含まれています。これらの斜体部分はプレースホルダであり、エラーメッセージが出力される場合には、実際の値、名称、文字列に置き換えられます。

RMS エラーコードの説明

各メッセージのプリフィックスには、問題を検出した RMS コンポーネントを示すエラーコードとメッセージ番号が含まれています。このプリフィックスは、必要に応じて問題の診断にあたる当社技術員 (SE)に提供してください。以下にエラーコードとそれに関連するコンポーネントを示します。

8.1 ADC: Admin 構成

● (ADC, 19) Clearing the cluster Wait state for SysNode <sysnode> by faking a successful host elimination. If <sysnode> is actually still online, and/or if any applications are online, this 'hvutil -u' command may result in data corruption.

ノードが Wait状態であるにもかかわらず、hvutil -u <sysnode> コマンドが実行されます。事前にノードを手動で終了していないと、データが破壊される場合があります。

対処法 :

シャットダウン機構でノードの終了に失敗した場合、ノードを手動で終了する必要があります。

● (ADC, 23) File <filename> can't be opened: <errortext>

リモートノードに送信するためのファイルを開くことができません。

対処法 :

<errortext> や、その他の WARNING/ERROR メッセージを確認してください。

ADC: Admin 構成

ADM: Admin キュー、コマンドキュー、およびディテクタキュー

BAS: 起動および構成設定エラー

BM: BM

CTL: コントローラ

CUP: userApplicationコントラクト

DET: ディテクタ

SCR: スクリプト

SWT: 切替要求 (hvswitchコマンド )

SYS: SysNodeオブジェクト

UAP: userApplicationオブジェクト

US: usファイル

WLT: Waitリスト

WRP: ラッパ

J2UZ-5294-06Z0(03) 179

Page 188: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

ADM:Admin キュー、コマンドキュー、およびディテクタキュー 付録 — 警告メッセージ

● (ADC, 24) File cannot be open for read.

リモートノードに送信するためのファイルを読み取ることができません。

対処法 :

メッセージ (ADC, 23) も出力されます。(ADC, 23) の <errortext> や、その他の WARNING/ERRORメッセージを確認してください。

● (ADC, 51) hvshut utility has timed out.

hvshutユーティリティでタイムアウト時間内に処理を完了できませんでした。

対処法 :

hvshut コマンドを再度実行してください。タイムアウトが続く場合は、オブジェクトの

ScriptTimeout属性を変更して、オフラインのタイムアウト時間を増やす必要があります。

● (ADC, 65) Since RMS on this host has already encountered other Online nodes, it will remain running. However, nodes reporting incorrect checksums will NOT be brought Online.

ローカル RMS の起動後、 初の 120 秒間に 1 つまたは複数のオンラインノードが検出されましたが、その後、他のノードから誤ったチェックサムが通知されました。ローカルノード上の RMS はシャットダウンしないで動作を続けていますが、不正なチェックサムを発信したノードはオンラインになりません。

対処法 :

すべてのノードの構成が同一であることを確認してください。

8.2 ADM:Admin キュー、コマンドキュー、およびディテクタキュー

● (ADM, 61) object is deactivated. Switch request skipped.

Deact状態のクラスタアプリケーションの切替え要求を実行できません。

対処法 :

クラスタアプリケーションを活性化して、切替え要求を再度実行してください。

● (ADM, 65) System <hostname> is currently down.

現在停止状態の対象ノードに対して hvswitchコマンドが実行されました。

対処法 :

対象ノードを起動して切替え要求を再度実行するか、別のノードを選択してください。

● (ADM, 69) Shutting down RMS while resource <resource> is not offline.

リソースがオフラインになっていない状態で RMS がシャットダウンしています。

対処法 :

シャットダウン要求が失敗した場合は、OfflineScriptにクラスタアプリケーションがオフ

ラインになるのを妨げるような問題が存在しないかどうかを確認してください。

180 J2UZ-5294-06Z0(03)

Page 189: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 警告メッセージ ADM:Admin キュー、コマンドキュー、およびディテクタキュー

● (ADM, 80) 'hvswitch' command ignored. Target application <userapplication> has its ControlledSwitch attribute set to 1, so it can only be switched by its parent controller.

ControlledSwitch 属性が 1 に設定されている制御対象アプリケーションが切替え要求の対象になっています。このアプリケーションを切替えることができるのは親コントローラのみであるため、切替え要求は取り消されました。

対処法 :

制御側アプリケーションに切替え要求を行ってください。

● (ADM, 105) Shutdown on target node <sysnode> in progress. Switch request for application <userapplication> skipped.

切替え先のノード <sysnode> でシャットダウン処理が進行中のため、<userapplication> の切替え要求は受付けられませんでした。

対処法 :

切替え先のノードのシャットダウンが完了後、そのノードを再起動してから、クラスタアプリケーションをそのノードへ切替えてください。

● (ADM, 110) SysNode <node> has been marked as going down, but failed to go offline. Check for a possibly hanging shutdown. To avoid cluster inconsistency, this SysNode cannot rejoin the cluster until it completes its shutdown.

SysNode <node> のシャットダウン中にタイムアウトが発生しました。

対処法 :

シャットダウンが中断されているかどうかを確認してから、ノードを再度シャットダウンしてください。

● (ADM, 111) Timeout occured for local hvshut request. Reporting a failure back to the command now.

hvshut コマンドがタイムアウトしたことを示しています。

対処法 :

RMS の環境変数である RELIANT_SHUT_MIN_WAIT を適切な値に設定してください。

● (ADM, 113) Terminating due to a timeout of RMS shutdown. All running scripts will be killed.

ローカル RMS のシャットダウン要求でタイムアウトが発生し、スクリプトの処理が未完了のまま、現在実行中のすべてのスクリプトが終了されます。

対処法 :

シャットダウンが中断されているかどうかを確認してから、RMS を再度シャットダウンして

ください。

J2UZ-5294-06Z0(03) 181

Page 190: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

BAS: 起動および構成定義エラー 付録 — 警告メッセージ

● (ADM, 114) userapplication: Shutdown in progress, and AutoSwitchOver attribute might include the ShutDown option, but the application failed to reach a settled Offline state. Switchover must be skipped.

RMS のシャットダウン中に userapplication が Offline状態への移行に失敗しました。この場合、AutoSwitchOver 属性に ShutDown オプションが指定されていても、スイッチオーバは取り消されます。

対処法 :

RMS のシャットダウンが完了し、切替え要求が取り消されていることを確認してください。その後、userapplication の切替えを手動で行ってください。また、Offline 状態への移行に失敗した原因についてはログを確認してください。

● (ADM, 115) Received "old style" shutdown contract, but no host with RMS 4.0 is member of the cluster. Discarding the contract.

RMS 4.0 以前を実行しているノードが存在しない場合でも、このノードは古いスタイルのコントラクトを受信し、受信したコントラクトは破棄されます。

対処法 :

対処する必要はありません。

● (ADM, 116) Received "new style" shutdown contract, but at least one host with RMS 4.0 is member of the cluster. Discarding the contract.

ノードが古いスタイルのコントラクトを想定している場合に新しいスタイルのコントラクトを受信すると、受信したコントラクトは破棄されます。

対処法 :

対処する必要はありません。

8.3 BAS: 起動および構成定義エラー

● (BAS, 1) Object <object> is not offline.

<object> のオフライン処理に失敗しました。オブジェクトは部分的に Online のままであるため、切替え要求は取り消されます。

対処法 :

ログを確認して <object> の Offline 処理が失敗した原因を突き止めてください。

● (BAS, 8) Object <object> has no rName attribute. The rName attribute is normally used by the generic detector to determine which resource to monitor. Be sure that your detector can function without an rName attribute.

オブジェクト <object> に rName属性が定義されていません。この属性は汎用 RMS ディテクタでは必須ですが、カスタムディテクタに存在しない可能性があります。

対処法 :

対応するカスタムディテクタの設計に問題がなければ、対処する必要はありません。ただし、このオブジェクトで現在または将来に汎用ディテクタを使用することを予定している場合は、rName属性を指定してください。

182 J2UZ-5294-06Z0(03)

Page 191: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 警告メッセージ BM:BM ( ベースモニタ )

● (BAS, 22) DetectorStartScript for kind <kind> is not defined in either .us or hvgdstartup files, therefore RMS will use default g<kind> -k<kind> -t<timeperiod>.

<kind> の DetectorStartScriptが未定義のため、RMS でデフォルトのディテクタ起動スクリプトが使用されます。

対処法 :

デフォルトディテクタスクリプトで問題がなければ、対処する必要はありません。問題がある場合は、DetectorStartScriptを適切に定義してください。

8.4 BM:BM ( ベースモニタ )

● (BM, 4) The CF cluster timeout <cftimeout> exceeds the RMS timeout <rmstimeout>. This may result in RMS node elimination request before CF timeout is exceeded. Please check the CF timeout specified in /etc/default/cluster.config and the RMS heartbeat miss time specified by hvcm '-h' option.

CF クラスタのタイムアウトが RMS のタイムアウトを超えています。この場合、CF がタイムアウトする前に RMS ノードの停止要求が発行される可能性があります。

対処法 :

/etc/default/cluster.configファイルに指定された CF のタイムアウト値と hvcm -hで指定された RMS ハートビートのタイムアウト値を確認してください。

● (BM, 8) Failure sending message <message> to object <object> on host <hostname>.

クラスタ内の他のノードにメッセージ <message> を送信中に問題が発生すると、このメッセージが出力されます。送信先ノードの RMS が停止しているか、ネットワークに問題がある可能性があります。

対処法 :

送信先ノードの RMS が稼動していること、およびネットワークに問題がないことを確認して

ください。

● (BM, 28) Application <userapplication> has ControlledSwitch attribute set to 1, so it can only be switched on or off from the controller. 'hvutil -f/-c' command ignored.

hvutil -f コマンドまたは hvutil -c コマンドで指定した制御対象アプリケーションにControlledSwitch 属性が設定されているため、これらの操作を親コントローラ以外で行うことはできません。

対処法 :

hvutil -fコマンドまたは hvutil -cコマンドで制御側アプリケーションを指定してくだ

さい。

J2UZ-5294-06Z0(03) 183

Page 192: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

BM:BM ( ベースモニタ ) 付録 — 警告メッセージ

● (BM, 30) Ignoring dynamic modification failure for object <object>: attribute <attribute> is invalid.

オブジェクト <object> の <attribute> 属性が無効です。

対処法 :

RMS 構成定義ファイルを修正してください。構成の作成および管理には、標準的な

PRIMECLUSTER 構成ツールのみを使用してください。

● (BM, 31) 86. Ignoring dynamic modification failure at line <linenumber>: cannot modify attribute <attribute> of object <object> with value <value> because the attribute does not exist.

RMS 構成定義ファイルの <linenumber> 行で指定された <attribute> 属性は、オブジェクト <object>では無効です。

対処法 :

RMS 構成定義ファイルを修正してください。構成の作成および管理には、標準的な

PRIMECLUSTER 構成ツールのみを使用してください。

● (BM, 53) The RMS-CF-CIP mapping cannot be determined for any host because the CIP configuration file <configfilename> cannot be opened. Verify that all entries in <configfilename> are correct and that CF and CIP are fully configured.

CIP 構成定義ファイルを開くことができないため、各ノードの RMS-CF-CIP のマッピングを確認できません。

対処法 :

CIP 構成定義ファイルに問題がないこと、および CF と CIP が正しく構成されていることを確

認してください。

● (BM, 70) Some messages were not sent during RMS shutdown.

RMS のシャットダウン中に、一部のメッセージがローカルまたはリモートの RMS プロセスに送信されませんでした。

対処法 :

OS のメッセージキューパラメタを確認し、ネットワークがローカルとリモートの RMS プロセス間でメッセージを送受信できる状態になっていることを確認してください。

● (BM, 76) Failed to find "rmshb" port address in /etc/services. The "hvutil -A" command will fail until a port entry for "rmshb" is made in the /etc/services file and RMS is restarted.

/etc/servicesに rmshbポートのエントリが存在しません。

対処法 :

/etc/servicesに rmshbのエントリを追加して、RMS を再起動してください。

184 J2UZ-5294-06Z0(03)

Page 193: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 警告メッセージ BM:BM ( ベースモニタ )

● (BM, 77) Failed to allocate a socket for "rmshb" port monitoring.

socket()の呼び出しで、rmshbのポートの割当てに失敗しました。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に

連絡して、ソケットが使用できない原因を突き止めてください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編> " を参照してください。

● (BM, 78) The reserved port for "rmshb" appears to be in use. The "rmshb" port is reserved in the /etc/services file but another process has it bound already. Select another port by editing the /etc/services file, propagating this change to all nodes in the cluster, and then restarting RMS.

RMS で rmshbネットワークポートの bind()が失敗しました。

対処法 :

/etc/services ファイルを編集し、rmshb の新しいポート番号を選択してから、RMS を再

起動してください。このポート番号はすべてのクラスタノードで同一にする必要があります。

● (BM, 82) A message to host <remotehost> failed to reach that host after <count> delivery attempts. Communication with that host has been broken.

<remotehost> が実行中であり、ノード間の通信が可能であることを確認してください。pingなどの標準的に方法で、ローカルのルートアカウントでリモートノードに rloginまたは rshができることを確認してください。通信が再度確立された後に、ローカルの RMS を再起動してください。

対処法 :

2 つのノード間の通信が確実に行われるようにしてください。その後ローカルの RMS モニタ

を再起動してください。

● (BM, 83) Failed to execute the fcntl system call.

RMS で fcntlを使って close-on-exec フラグを設定することができませんでした。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に

連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブル

シューティング編> " を参照してください。

● (BM, 85) Application <userapplication> has its ControlledSwitch attribute set to 1, so it can only be deactivated by the parent controller. 'hvutil -d' command ignored.

hvutil -d <userapplication>コマンドが起動されましたが、ターゲットとしてControlledSwitch属性が 1 に設定された制御対象アプリケーションが指定されているため、親コントローラ以外で無効にすることができません。

対処法 :

hvutil -dコマンドで制御側アプリケーションを指定してください。

J2UZ-5294-06Z0(03) 185

Page 194: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

CTL: コントローラ 付録 — 警告メッセージ

● (BM, 86) Application <userapplication> has its ControlledSwitch attribute set to 1, so it can only be deactivated by the parent controller. 'hvutil -D' command ignored.

hvutil -D <userapplication> コマンドが起動されましたが、ターゲットとして ControlledSwitch属性が 1 に設定された制御対象アプリケーションが指定されているため、親コントローラ以外で無効にすることができません。

対処法 :

hvutil -Dコマンドで制御側アプリケーションを指定してください。

● (BM, 112) Controller <controller> has its Follow attribute set to 1, while its ClusterExclusive attribute is set to 0. However, it is controlling, directly or indirectly via a chain of Follow controllers, an application <application>. That application contains a resource named <resource> that has its ClusterExclusive attribute set to 1. This is not allowed because the application, along with its child resource, could potentially go online on more than one host. Cluster exclusive resources must be controlled by cluster exclusive Follow controllers.

ClusterExclusive ではないフォローコントローラがグラフに ClusterExclusive リソースとして表示されます。

対処法 :

RMS 構成を修正して、フォローコントローラも ClusterExclusive にしてください。または、リ

ソースの性質によっては、ClusterExclusive の制限を解除することが可能な場合があります。

● (BM, 119) The RMS base monitor failed to be locked in memory via mlockall(). Reason: <errortext>.

HV_MLOCKALL 環境変数を 1 に設定すると、ベースモニタプロセスおよびベースモニタプロセスによって割り当てられたメモリがメモリにロックされます。この場合、RMS ベースモニタをメモリにロックできませんが、ロックされていないメモリを使用して実行が続けられます。

対処法 :

<errortext> で原因を突き止め、十分なメモリがあることを確認してください。

8.5 CTL: コントローラ

● (CTL, 6) Controller <controller> has detected more than one controlled application Online.

1 つまたは複数のノード上で複数の制御対象アプリケーションがオンラインになっています。

対処法 :

1 つのコントローラで複数の制御対象アプリケーションがオンラインになっていないことを確

認してください。

186 J2UZ-5294-06Z0(03)

Page 195: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 警告メッセージ CUP:userApplication コントラクト

● (CTL, 7) Controller <controller> has its attribute IgnoreOnlineRequest set to 1 and its OnlineScript is empty. Therefore, an online request to the controller might fail to bring the controlled application online.

コントローラの IgnoreOnlineRequest属性が 1 に設定され、OnlineScriptが空であるため、コントローラに対するオンライン要求が失敗して、制御対象アプリケーションをオンラインにできない場合があります。

対処法 :

この動作で問題がなければ、対処する必要はありません。コントローラで制御対象アプリケーションをオンラインにする必要がある場合は、設定の変更を検討してください。

● (CTL, 8) Controller <controller> has its attribute IgnoreOffineRequest set to 1 and its OffineScript is empty. Therefore, an offline request to the controller might fail to bring the controlled application offline.

コントローラの IgnoreOffineRequest属性が 1 に設定され、OnlineScriptが空であるため、コントローラに対するオフライン要求が失敗して、制御対象アプリケーションをオフラインにできない場合があります。

対処法 :

この動作で問題がなければ、対処する必要はありません。問題がある場合は、設定の変更を検討してください。

● (CTL, 11) Controller <controller> has its attribute StandbyCapable set to 1, its attribute IgnoreStandbyRequest set to 1, and its OnlineScript is empty. Therefore, a standby request to the controller might fail to send the controlled application to the Standby state.

コントローラの StandbyCapable属性が 1 に設定され、IgnoreStandbyRequest属性が 1 に設定され、OnlineScript が空であるため、コントローラに対するスタンバイ要求が失敗して、制御対象アプリケーションを Standby状態にできない場合があります。

対処法 :

この動作で問題がなければ、対処する必要はありません。問題がある場合は、設定の変更を検討してください。

8.6 CUP:userApplication コントラクト

● (CUP, 1) userapplication: priority list conflict detected. Trying again...

userApplication が、ノード <Sysnode> で Online に遷移しようとしましたが、そのノードで排他関係にある userApplication がすでに Online となっているため、Online に遷移するノードの再確認が必要となった場合に出力されます。このメッセージは Online となるノードが priority list(Machinesの順番)と異なる場合があるため WARNING として出力されます。

対処法 :

動作に問題はないため、対処不要です。

● (CUP, 9) userapplication: Processing of current online host contract is not yet settled. Switch Request skipped.

現在 Online のノードコントラクトの処理が未解決であるため、切替え要求が取り消されました。

対処法 :

クラスタアプリケーションがOnlineにならない場合は、手動切替え要求を呼び出してください。

J2UZ-5294-06Z0(03) 187

Page 196: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

CUP:userApplication コントラクト 付録 — 警告メッセージ

● (CUP, 11) userapplication: Offline processing failed, and the application is still partially online. Switch request skipped.

userapplication の Offline 処理に失敗しました。userapplication は部分的に Online のままであるため、切替え要求は取消されます。

対処法 :

ログファイルを確認して、Offline 処理が失敗した原因を突き止めてください。

● (CUP, 12) userapplication: The required target node is not ready to go online. Switch request skipped.

切替え要求で、Online になっていない SysNode が指定されました。

対処法 :

指定した SysNode が Online になってから、切替え要求を再度実行してください。

● (CUP, 13) userapplication: No available node is ready to go online. Switch request skipped.

切替え要求が実行されましたが、Online 状態にある SysNode が存在しません。

対処法 :

対象の SysNode が Online になってから、切替え要求を再度実行してください。

● (CUP, 14) userapplication did not get a response from <sender>.

タイムアウトが発生しました。

対処法 :

userapplication が Online にならない場合は、他のすべてのノード上で userapplication が Online になっていないことを確認してから、手動で切替えを実行してください。

● (CUP, 15) userapplication: Target host <hostname> is no longer available.

切替え要求が呼び出されましたが、対象ノードが使用できません。

対処法 :

対処する必要はありません。

● (CUP, 16) userapplication: Offline processing failed, and the application is still partially online. Switch request skipped.

userapplication の Offline 処理に失敗しました。userapplication は部分的に Online のままであるため、切替え要求は取り消されます。

対処法 :

ログファイルを確認して、Offline 処理が失敗した原因を突き止めてください。

188 J2UZ-5294-06Z0(03)

Page 197: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 警告メッセージ CUP:userApplication コントラクト

● (CUP, 17) userapplication: current online host request for host <hostname> accepted. Local inconsistency has been overridden with the forced switch option ('hvswitch -f').

ローカルの Inconsistent状態が存在しますが、強制切替オプション (hvswitch -f) が指定されている現在のオンラインノード要求が受け入れられ、ローカルの不整合はオーバーライドされました。

対処法 :

対処する必要はありません。

● (CUP, 18) userapplication: current online request of host <hostname> denied due to a local inconsistent state.

ローカルの Inconsistent状態が原因で現在のオンラインノード要求が拒否されます。

対処法 :

Inconsistent状態をクリアしてください。または強制切替オプション (hvswitch -f) を使

用して制限を解消することもできます。

● (CUP, 19) userapplication: is online locally, but is inconsistent on another host. Trying to force a CurrentOnlineHost contract.

アプリケーションは現在ローカルノード上で Online になっています。アプリケーションは強制切替オプションを指定して別のノードに切替えられ、不整合は解消されます。

対処法 :

対処する必要はありません。

● (CUP, 20) userapplication: AutoStartUp skipped. Application is inconsistent on host <hostname>.

Inconsistent状態であるため、AutoStartUpの処理は取り消されます。

対処法 :

Inconsistent状態をクリアしてください。

● (CUP, 21) userapplication: Failover skipped. Application is inconsistent on host <hostname>.

Inconsistent状態であるため、フェイルオーバ処理が取り消されます。

対処法 :

Inconsistent状態をクリアしてください。

● (CUP, 22) userapplication: Switch request skipped. Application is inconsistent on host <hostname>.

Inconsistent状態であるため、切替え要求は取り消されます。

対処法 :

Inconsistent状態をクリアしてください。

J2UZ-5294-06Z0(03) 189

Page 198: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

CUP:userApplication コントラクト 付録 — 警告メッセージ

● (CUP, 23) userapplication: Switch request skipped. Application is inconsistent on local host.

Inconsistent状態であるため、切替え要求は取り消されます。

対処法 :

Inconsistent状態をクリアしてください。

● (CUP, 24) userapplication: Switch Request processed. Local inconsistency has been overridden with the forced switch option.

Inconsistent 状態ですが、強制切替オプション (hvswitch -f) により切替え要求が受け入れられ、不整合状態が解消されました。

対処法 :

対処する必要はありません。

● (CUP, 25) userapplication is currently in an inconsistent state. Switch request skipped. Clear inconsistency first, or override with the forced switch option.

userApplication が現在ローカルノード上で Inconsistent 状態です。Inconsistent 状態をクリアしないかぎりアプリケーションを切替えることはできないため、切替え要求は取り消されます。

対処法 :

Inconsistent 状態をクリアしてください。

● (CUP, 26) userapplication: LastOnlineHost conflict detected. Processing an AutoStart or PrioritySwitch CurrentOnlineHost Contract with OnlinePriority enabled. Target host of switch request is host <hostname>, but the local host is the LastOnlineHost. Denying the request.

LastOnlineHostの矛盾が検出され、ローカルノードが LastOnlineHostであるため、ローカルノード上のアプリケーションが Online になります。

対処法 :

対処する必要はありません。

● (CUP, 27) userapplication: LastOnlineHost conflict occurred. Skipping local Online request, because host <hostname> has a conflicting LastOnlineHost entry.

LastOnlineHostの矛盾が検出され、ローカルノードが LastOnlineHostではないため、他のノード上のアプリケーションが Online になります。

対処法 :

対処する必要はありません。

190 J2UZ-5294-06Z0(03)

Page 199: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 警告メッセージ CUP:userApplication コントラクト

● (CUP, 28) userapplication: Cannot get deterministic information about the LastOnlineHost. Tried to switch to <hostname>, but <loh> claims to be the LastOnlineHost. Priority switch skipped. Conflict may be resolved by operator intervention: use hvswitch command with an explicit target host.

LastOnlineHost の矛盾が検出され、RMS が LastOnlineHost を確認できないため、アプリケーションはどのノード上でも Online になりません。

対処法 :

対象ノードを指定する切替え要求を実行してください。

● (CUP, 29) userapplication: LastOnlineHost conflict occurred. Timestamps of conflicting LastOnlineHosts entries do not allow a safe decision, because their difference is lower than <time> seconds. Conflict must be resolved by operator intervention: invalidate LastOnlineHost entry via 'hvutil -i <userapplication>', and then invoke an explicit hvswitch command.

LastOnlineHost のタイムスタンプエントリの誤差が HV_LOH_INTERVAL 未満でした。そのため、アプリケーションはどのノード上でも Online になりません。

対処法 :

LastOnlineHost のエントリを hvutil -i <userapplication> で無効にし、対象ノードを指定して切替

え要求を実行してください。

● (CUP, 30) userapplication: Denying maintenance mode request. userApplication is busy or is in the Faulted state.

userapplication がビジー状態または Faulted 状態であるため、保守モードの要求 (hvutil -mon/off) が拒否されます。

対処法 :

Faulted状態をクリアし、保守モードの要求を再度実行してください。

● (CUP, 31) userapplication: maintenance mode request was denied by the remote SysNode <hostname> because userApplication is busy, in the Faulted state, or not ready to leave maintenance mode. See remote switchlog for details.

リモートノードの userapplication がビジー状態または Faulted状態であるか、保守モードを終了する準備ができていないため、保守モードの要求 (hvutil -m on/off) が拒否されます。

対処法 :

リモートノードの switchlog で詳細を確認してください。

● (CUP, 32) userapplication: Denying maintenance mode request. The following object(s) are not in an appropriate state for safely returning to normal operation: <resource>

リソースが適切な状態でないため、安全に通常の処理に戻ることができません。このため、保守モードの要求 (hvutil -m on/off) が拒否されます。

対処法 :

指摘されているリソースの状態を修正してください。

J2UZ-5294-06Z0(03) 191

Page 200: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

DET: ディテクタ 付録 — 警告メッセージ

● (CUP, 33) userapplication: Denying maintenance mode request. The initialization of the state of the userApplication is not yet complete.

userapplication の状態の初期化が完了していないため、保守モードの要求 (hvutil -m on/off)が拒否されます。

対処法 :

userapplication の初期化が完了してから、保守モードの要求を再度実行してください。

● (CUP, 34) userapplication: LastOnlineHost conflict detected. Processing an AutoStart or PrioSwitch CurrentOnlineHost Contract with OnlinePriority enabled. Target of switch request is host <hostname>, but the local host is the LastOnlineHost. The local host takes over switch request.

LastOnlineHostの矛盾が検出され、ローカルノードが LastOnlineHostであるため、ローカルノード上のアプリケーションが Online になります。

対処法 :

対処する必要はありません。

8.7 DET: ディテクタ

● (DET, 29) Resource <resource>: received detector report DetReportsOnlineWarn. The WarningScript <warningscript> will be run.

情報メッセージです。

対処法 :

対処する必要はありません。

● (DET, 31) Resource <resource>: Received detector report DetReportsOfflineFaulted. The posted state will become OfflineFault until one of the following reports is received: DetReportsOffline, DetReportsOnline, DetReportsStandby, or DetReportsFaulted.

情報メッセージです。

対処法 :

対処する必要はありません。

● (DET, 35) Resource <resource>: received detector report DetReportsOnlineWarn. The WarningScript is not defined and therefore will not be run.

情報メッセージです。

対処法 :

対処する必要はありません。

192 J2UZ-5294-06Z0(03)

Page 201: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 警告メッセージ SCR: スクリプト

8.8 SCR: スクリプト

● (SCR, 17) Resource <resource>: WarningScript has failed with status <status>.

リソースの WarningScriptが失敗しました。

対処法 :

ログファイルで詳細なエラー情報を確認してください。

● (SCR, 25) Controller <resource>: StateChangeScript has failed with status <status>.

StateChangeScript が、終了コード status で終了しました。

対処法 :

終了コード status を通知した、Controller の StateChangeScript で設定したスクリプトに問題が

ないか調査してください。

8.9 SWT: 切替え要求 (hvswitch コマンド )

● (SWT, 1) userapplication: AutoStartUp attribute is set, but the HV_AUTOSTART_WAIT timeout has expired. Application autostartup skipped because not all necessary cluster hosts are online.

AutoStartup=1 で、かつ、PartialCluster=0 で、かつ、全ノード起動が HV_AUTOSTART_WAIT の時間内に行われなかったことを示しています。

対処法 :

対処する必要はありません。

● (SWT, 5) object: AutoStartUp skipped because object is faulted.

Faulted状態であるため、AutoStartUpは取り消されます。

対処法 :

Faulted状態をクリアしてください。

● (SWT, 6) object: AutoStartUp skipped because a Fault occurred during initialization.

Faulted状態であるため、AutoStartUpは取り消されます。

対処法 :

Faulted状態をクリアしてください。

● (SWT, 7) object: AutoStartUp skipped because userApplication is deactivated.

クラスタアプリケーションが Deact 状態であるため、AutoStartUpは取り消されます。

対処法 :

クラスタアプリケーションの Deact 状態を解除し、アプリケーションを手動で起動してくださ

い。

J2UZ-5294-06Z0(03) 193

Page 202: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

SWT: 切替え要求 (hvswitch コマンド ) 付録 — 警告メッセージ

● (SWT, 8) object: AutoStartUp skipped because not all necessary cluster hosts are online.

PartialCluster 属性が 0 に設定され、必要なすべてのクラスタノードが Online にならないため、AutoStartUpが取り消されます。

対処法 :

必要なすべてのクラスタノードで RMS を起動した後、必要に応じてアプリケーションを手動

で起動してください。

● (SWT, 11) object: no responsible node available. Switch request skipped.

使用可能なメンバノードが存在しないため、切替え要求は取り消されます。

対処法 :

メンバノードを有効にし、切替え要求を再度実行してください。

● (SWT, 12) object is busy or locked. Switch request skipped.

<object> がビジーまたはロック状態であるため、切替え要求は取り消されます。

対処法 :

<object> が切替え可能な状態になるまで待機してから、切替え要求を再度実行してください。

● (SWT, 13) Not all necessary cluster hosts for application <userapplication> are online, switch request is being skipped. If the application should be brought online anyway, use the force flag. Be aware, however, that forcing the application online could result in an inconsistent cluster if the application is online somewhere else!

アプリケーションに必要なすべてのクラスタノードが Online になっていないため、切替え要求は取り消されます。

対処法 :

アプリケーションを Online にする必要がある場合は、強制切替オプション(hvswitch -f) を使

用してください。

注意:強制切替えを実施した場合、整合性が失われたりデータが破損する場合があるので注意が必要です。Solaris 版 PRIMECLUSTER では、クラスタアプリケーションの強制切替え時に

データが破損するリスクを低減するため、RMS が起動していないノードを強制停止してから

クラスタアプリケーションを強制起動する場合があります。

● (SWT, 14) object is deactivated. Switch request skipped.

アプリケーションが Deact 状態であるため、切替え要求は取り消されます。

対処法 :

アプリケーションの Deact 状態を解除し、切替え要求を再度実行してください。

● (SWT, 16) No target host found or target host is not ready to go online. Switch request skipped.

切替えに指定したノードが見つからないか、Online にする準備ができていないため、切替え要求は取り消されます。

対処法 :

対象ノードが Online になるまで待機するか、対象ノードを起動してください。

194 J2UZ-5294-06Z0(03)

Page 203: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 警告メッセージ SWT: 切替え要求 (hvswitch コマンド )

● (SWT, 18) object is not ready to go online on local host. Switch request skipped.

アプリケーションまたはローカルノードが遷移状態であるため、切替え要求は取り消されます。

対処法 :

アプリケーションとローカルノードが Online になってから、切替え要求を再度実行してくださ

い。

● (SWT, 19) object: is not ready to go online on local host. Trying to find another host.

優先順位または last online host 切替えが指定されている場合、切替対象ノードとなるノードでアプリケーション障害が発生すると切替え要求は拒否され、クラスタ内の他のノードに転送されます。

対処法 :

対処する必要はありません。

● (SWT, 21) object: Local node has Faulted or OfflineFaulted descendants, but no other node is ready to go online. Switchover skipped.

ローカルノードに Faultedまたは OfflineFaulted状態の子孫が存在し、他のノードがオンラインになる準備ができていないため、切替え要求は取り消されます。

対処法 :

Faulted状態をクリアしてください。

● (SWT, 22) object: local node has Faulted or OfflineFaulted descendants. Forwarding switchover request to next host: <targethost>.

ローカルノードに Faultedまたは OfflineFaulted状態の子孫が存在するため、切替え要求は他のノードに転送されます。

対処法 :

対処する必要はありません。

● (SWT, 23) object is busy or locked. Deact request skipped.

対象アプリケーションがビジーまたはロック状態の場合、Deact要求を処理できません。

対処法 :

対象アプリケーションの状態が変更されるまで待機してから、Deact 要求を再度実行してくだ

さい。

● (SWT, 24) object is deactivated. Switch request skipped.

対象アプリケーションが Deact状態の場合、切替え要求を処理できません。

対処法 :

対象アプリケーションを活性化してください。

● (SWT, 28) hostname is unknown locally.

切替え要求の処理中に、対象ノード名が見つかりませんでした。

対処法 :

ノードの状態を確認してください。

J2UZ-5294-06Z0(03) 195

Page 204: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

SWT: 切替え要求 (hvswitch コマンド ) 付録 — 警告メッセージ

● (SWT, 30) <object> was Online on <onlinehost>, which is not reachable. Switch request must be skipped to ensure data integrity. This secure mechanism may be overridden with the forced flag (-f) of the hvswitch command. WARNING: Ensure, that no further access to the data is performed by <onlinehost>, otherwise the use of the -f flag may break data consistency!

object はリモートノード onlinehost で Online 状態でしたが、現在操作不能です。強制停止オプション(hvshut -f)を指定して onlinehost をシャットダウンしたか、またはタイミングの問題が原因の可能性があります。データ保護のため、切替要求は取り消されます。

対処法 :

アプリケーションを Online にする必要がある場合は、強制切替オプション(hvswitch -f)を使用してください。

注意:強制切替えを実施した場合、整合性が失われたりデータが破損する場合があるので注意が必要です。Solaris 版 PRIMECLUSTER では、クラスタアプリケーションの強制切替え時に

データが破損するリスクを低減するため、RMS が起動していないノードを強制停止してから

クラスタアプリケーションを強制起動する場合があります。onlinehost をシャットダウンする際に強制停止オプション(hvshut -f)を指定していない場

合は、タイミングの問題が考えられますので、しばらく待ってから再度切替えを行ってください。

● (SWT, 31) <object> was Online on <onlinehost>, which is not reachable. Caused by the use of the force flag the RMS secure mechanism has been overridden, Switch request is processed.

object はリモートノード onlinehost で Online 状態でしたが、現在操作不能です。ただし、強制切替オプション(hvswitch -f)が使用されたため、切替要求は処理されます。

対処法 :

対処する必要はありません。

● (SWT, 32) <object> is currently in an inconsistent state on local host. The switch request is being skipped. Clear inconsistency first or you may override this restriction by using the forced switch option.

アプリケーションが現在ローカルノード上で Inconsistent 状態です。Inconsistent 状態をクリアしないかぎりアプリケーションを切替えることはできないため、切替え要求は取り消されます。

対処法 :

Inconsistent 状態をクリアしてください。

アプリケーションを Online にする必要がある場合は、強制切替オプション(hvswitch -f)を使

用してください。

注意:強制切替えを実施した場合、整合性が失われたりデータが破損する場合があるので注意が必要です。Solaris 版 PRIMECLUSTER では、クラスタアプリケーションの強制切替え時に

データが破損するリスクを低減するため、RMS が起動していないノードを強制停止してから

クラスタアプリケーションを強制起動する場合があります。

196 J2UZ-5294-06Z0(03)

Page 205: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 警告メッセージ SWT: 切替え要求 (hvswitch コマンド )

● (SWT, 33) <object> is not ready to go online on the local host. Due to a local inconsistent state no remote targethost may be used. The switch request is being skipped.

アプリケーションが現在ローカルノード上で Inconsistent 状態です。Inconsistent 状態をクリアしないかぎりアプリケーションを切替えることはできないため、切替え要求は取り消されます。

対処法 :

Inconsistent 状態をクリアしてください。

アプリケーションを Online にする必要がある場合は、強制切替オプション(hvswitch -f)を使

用してください。

注意:強制切替えを実施した場合、整合性が失われたりデータが破損する場合があるので注意が必要です。Solaris 版 PRIMECLUSTER では、クラスタアプリケーションの強制切替え時に

データが破損するリスクを低減するため、RMS が起動していないノードを強制停止してから

クラスタアプリケーションを強制起動する場合があります。

● (SWT, 34) object is not ready to go online on local host. Trying to find another host.

クラスタアプリケーションをローカルノード上で Online にする準備ができていないため、RMS は切替え要求を優先順位リストの次のノードに転送します。

対処法 :

対処する必要はありません。

● (SWT, 35) object is not ready to go online on local host. Switch request skipped.

クラスタアプリケーションをローカルノード上で Online にする準備ができていないため、直接切替要求は取り消されます。

対処法 :

クラスタアプリケーションが Online になるまで待機してから、切替え要求を再試行してくださ

い。

● (SWT, 36) sysnode is in the Wait state. Switch request skipped.

sysnode が Wait状態であるため、切替え要求は取り消されます。

対処法 :

ノードの Wait状態が終了するまで待機してから、切替え要求を再度実行してください。

● (SWT, 37) AutoStartUp for application <userapplication> is ignored because hvmod was invoked with the '-i' flag.

AutoStartUp 属性を 1 に設定しても、hvmod -i コマンドでこの機能が無効となるため、アプリケーションを自動起動できません。

対処法 :

対処する必要はありません。

J2UZ-5294-06Z0(03) 197

Page 206: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

SWT: 切替え要求 (hvswitch コマンド ) 付録 — 警告メッセージ

● (SWT, 58) Processing policy switch request for application <userapplication>. The cluster host <sysnode> is in the Wait state, so no switch request can be processed. The application will go offline now.

ポリシー切替要求が発行されているため、<userapplication> の状態を変更する必要がありますが、<sysnode> が Wait 状態であるため、Offline 処理以外の切替え要求を処理できません。そのため、アプリケーションは Offline になります。

対処法 :

ノードの Wait状態が終了するまで待機してから、アプリケーションの状態を確認してくださ

い。場合によっては、アプリケーションの手動切替え要求を発行する必要があります。

● (SWT, 59) Processing policy switch request for application <userapplication>. No cluster host is available to take over this application. The application will go offline now.

ポリシー切替要求が発行されているため、<userapplication> の状態を変更する必要がありますが、アプリケーションを引継ぐことができるクラスタノードがありません。そのため、アプリケーションは Offline になります。

対処法 :

アプリケーションの優先順位リストにあるノードを有効にしてください。

● (SWT, 60) Processing policy switch request for application <userapplication>, which is in the Standby state. The application will go offline now.

ポリシーの切替え中に排他アプリケーションがノードに切替わると、Standby状態のすべてのアプリケーションは、優先順位が低いため、Offline になります。このメッセージは、アプリケーションが Standby 状態にあり、上記の理由から Offline になることをユーザに通知する警告メッセージです。

対処法 :

対処する必要はありません。

● (SWT, 69) AutoStartUp for application <userapplication> is ignored because the environment variable HV_AUTOSTARTUP is set to 0.

HV_AUTOSTARTUP 環境変数が 0 に設定されていることにより各アプリケーションのAutoStartUp属性が無効になります。アプリケーションは自動起動しません。

対処法 :

各アプリケーションの AutoStartUp 属性に従ってアプリケーションが起動させるには、

HV_AUTOSTARTUP環境変数を 1 に設定してください。

● (SWT, 72) userapplication received Maintenance Mode request from the controlling userApplication. The request is denied, because the state is either Faulted or Deact or the application is busy or locked.

状態が Faultedまたは Deactであるか、アプリケーションがビジーまたはロック中であるため、制御側 userapplication からの保守モード要求は拒否されます。

対処法 :

Faultedまたは Deact状態をクリアしてから、保守モード要求を再度実行してください。

198 J2UZ-5294-06Z0(03)

Page 207: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 警告メッセージ SYS:SysNode オブジェクト

8.10 SYS:SysNode オブジェクト

● (SYS, 16) The RMS internal SysNode name <sysnode> is not compliant with the RMS naming convention. A non-compliant setting is possible, but this will cause all RMS commands to accept only the SysNode name, and not the Unix hostname (uname -n), of the cluster nodes.

RMS の内部 SysNode名が <sysnodename>RMSという形式ではありません。

対処法 :

構成の SysNode名を <sysnodename>RMSに変更してください。

● (SYS, 18) The SysNode <sysnode> does not follow the RMS naming convention for SysNodes. To avoid seeing this message in the future, rename the SysNode to use the CF-based name of the form "<CFname>RMS" and restart RMS.

RMS の SysNode 名が <CFname>RMS と一致してません。

対処法 :

SysNode 名を <CFname>RMS に変更してください。

● (SYS, 88) No heartbeat from cluster host <hostname> within the last 10 seconds. This may be a temporary problem caused by high system load. RMS will react if this problem persists for <time> seconds more.

RMS 間のハートビートが途切れ、<time > 秒以上たっても応答がない場合、強制停止を実行します。

対処法 :

以下の要因が考えられます。要因に従って対処を行ってください。

– クラスタインタコネクトがハード故障により通信ができない。

LAN カード交換、ケーブル交換などを行い、ハード故障の要因を取り除いてください。

– RMS がハートビート処理できないほど、システムの CPU 負荷が長時間発生している。

<SysNode > のホストが高負荷となっている処理を見直してください。

– NTP で急激な時刻戻しが行われた。

NTP でゆっくりとした時刻合わせを行ってください。

● (SYS, 99) The AlternateIp attribute specified for SysNode <sysnode> should not be used in CF mode. Ignoring the attribute.

<sysnode> の AlternateIp 属性が指定されていますが、CF が存在するクラスタ内で相互接続に使用されていません。そのため、AlternateIp属性の指定は無視されます。

対処法 :

AlternateIp属性の設定を解除してください。

J2UZ-5294-06Z0(03) 199

Page 208: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

UAP:userApplication オブジェクト 付録 — 警告メッセージ

8.11 UAP:userApplication オブジェクト

● (UAP, 2) object got token token from node node. TOKEN SKIPPED! - Reason: errortext.

Reason の理由により処理を実行しない場合に出力されます。例えば、クラスタアプリケーションが Standby へ移行する前処理(PreCheck 処理)の実行中に Offline 処理の要求が発行されていますが、クラスタアプリケーション は Standby への処理を行っているため、Offline 処理を実行しない旨で出力されています。

対処法 :

このメッセージは何らかの処理を実行中に Cluster Admin 等で別の処理をしようとした場合な

どに出力されるメッセージであり、RMS の動作には問題ありません。

● (UAP, 3) object: double fault occurred and Halt attribute is set to 1. Halt attribute will be ignored, because no other cluster host is available.

切替え可能なノードが存在しません。Halt 属性は無視されます。

対処法 :

切替え可能なクラスタノードを確認してください。

● (UAP, 4) object has gone online, but is also in the HV_AUTOSTARTUP_IGNORE list of cluster hosts to be ignored on startup. The cluster may be in an inconsistent condition.

HV_AUTOSTARTUP_IGNORE 環境変数に表示されている RMS クラスタノードが Offline になりました。

対処法 :

HV_AUTOSTARTUP_IGNORE環境変数の内容に間違いがないことを確認してください。

● (UAP, 11) object is not ready to go online on local node. Online processing skipped.

ローカルノード上のクラスタアプリケーションはビジーまたは Faulted状態であるため、Onlineになる準備ができていません。

対処法 :

Faulted状態をクリアしてください。

● (UAP, 12) object: target host of switch request <hostname> is no longer available. Request skipped.

切替え要求の対象ノードが使用不可になったため、切替え要求は取り消されます。

対処法 :

対象ノードを有効にしてください。

● (UAP, 14) object is not ready to go online on local host. Switch request skipped.

クラスタアプリケーションをローカルノード上で Online にする準備ができていないため、切替え要求は取り消されます。

対処法 :

対処する必要はありません。

200 J2UZ-5294-06Z0(03)

Page 209: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 警告メッセージ US:us ファイル

● (UAP, 18) SendUAppLockContract(): invalid token: <token>.

コントラクトの処理中に無効なトークンを受信しました。

対処法 :

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に

連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブル

シューティング編> " を参照してください。

● (UAP, 25) AutoStartUp skipped by <object>. Reason: not all necessary cluster hosts are online.

必要なすべてのクラスタノードが Online になっていないため、クラスタアプリケーションは自動起動しませんでした。

対処法 :

必要なすべてのクラスタノードを Online にしてください。

● (UAP, 30) object is not ready to go online on local host. Trying to find another host.

ローカルノード上のクラスタアプリケーションはOnlineになる準備ができていないため、別のノードを検索します。

対処法 :

対処する必要はありません。

● (UAP, 52) userapplication: double fault occurred and Halt attribute is set. Halt attribute will be ignored, because attribute AutoSwitchOver is set to <attrvalue>.

AutoSwitchOver属性を <attrvalue> に設定すると、Halt属性は無視されます。

対処法 :

Halt属性を有効にする場合は、AutoSwitchOver属性を適切に変更してください。

8.12 US:us ファイル

● (US, 10) object: userApplication transitions into the Online state, even though it was previously in the Faulted state according to persistent fault info. Check for possible inconsistencies.

持続性のある障害情報が設定されていますが、userApplication は Faulted 状態ではなく、Online状態になりました。

対処法 :

他の RMS ノード上の同一アプリケーションの状態が Inconsistentであるか、Onlineであ

るかを確認してください。

J2UZ-5294-06Z0(03) 201

Page 210: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

US:us ファイル 付録 — 警告メッセージ

● (US, 23) object: double fault occurred. Processing terminated.

二重障害が発生したため、<object> の処理を中止します。

対処法 :

switchlog 内の他のメッセージを確認して二重障害の原因を突き止め、二重障害を解消してくだ

さい。

● (US, 28) object: PreCheck failed. Switch request will be cancelled now and not be forwarded to another host, because this was a directed switch request with an explicit target host.

直接切替要求(対象ノードが明示的に指定されている切替え要求) の処理中に PreCheckScript が失敗しました。切替え要求は取り消され、優先順位リスト上の次のノードに転送されません。

対処法 :

新しい切替え要求を呼びだし、次の優先順位のノードを対象ノードに指定してください。RMSで切替え要求が自動転送される場合、優先切替え(対象ノードを指定しない hvswitch)を呼び

出す必要があります。

● (US, 29) object: PreCheck failed. Trying to find another host...

優先切替え要求の処理中に PreCheckScript が失敗しました。この場合、切替え要求は取り消され、優先順位リスト上の次のノードに転送されます。

対処法 :

対処する必要はありません。

● (US, 43) object: PreCheck failed. Standby request cancelled.

PreCheckScriptの実行が失敗し、Standby 処理が中止されます。

対処法 :

PreCheckScriptが失敗した原因を突き止め、必要に応じてスクリプトを修正してください。

● (US, 45) object: PreCheck failed. The switch request will be cancelled now and not be forwarded to another host, because the AutoSwitchOver attribute did not include the ResourceFailure option.

PreCheckScript が失敗しました。AutoSwitchOver 属性に ResourceFailure オプションが指定されていないため、RMS は自動処理を行いません。切替え要求は取り消され、優先順位リスト上の次のノードに転送されません。

対処法 :

新しい切替え要求を呼びだし、次の優先順位のノードを対象ノードに指定してください。RMSで切替え要求を自動転送する場合は、AutoSwitchOver 属性の ResourceFailure オプションをオン

にしてください。

202 J2UZ-5294-06Z0(03)

Page 211: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 警告メッセージ WLT:Wait リスト

● (US, 47) userapplication: Processing of Clear request resulted in a Faulted state. Resuming Maintenance Mode nevertheless. Clear the fault condition before leaving Maintenance Mode.

<userapplication> に対して Clear要求 (hvutil -c) が発行されました。クリアに失敗したため、アプリケーションが Faulted状態になりました。

対処法 :

switchlog を確認してエラーの原因を突き止め、障害状態を修正してから hvutil -c を再度実行し

てください。また、障害状態がクリアされるまでは保守モードを終了しないでください。

● (US, 55) PreCheck failed for &Local& &gController& <controller>: the descendant controlled &userApplication& <userapplication> was not ready to perform a PreCheck.

制御側アプリケーションの PreCheck 時に、ローカルモードの各子アプリケーションのPreCheckScriptが自動実行されます。PreCheckRequestを実行できない状態の子アプリケーションが 1 つでもあれば、PreCheck は失敗します。通常、このエラーはビジー状態またはリソース障害が原因で発生します。

対処法 :

すべての制御対象アプリケーションを含むグラフ全体の状態が解決したら、すぐに要求を再発行してください。リソース障害の場合は、まず障害を適切に解消する必要があります。

8.13 WLT:Wait リスト

● (WLT, 6) The script of resource <resource> did not terminate gracefully after receiving SIGTERM.

リソースのスクリプトが正常に終了しませんでした。

対処法 :

スクリプトでタイムアウトが発生していないかどうかを確認してください。

J2UZ-5294-06Z0(03) 203

Page 212: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

WRP: ラッパ 付録 — 警告メッセージ

8.14 WRP: ラッパ

● (WRP, 11) Message send failed, queue id <queueid>, process <process>, <name>, to host <hostname>.

RMS はノード間でメッセージを交換してノード間の通信を維持します。メッセージの配信が失

敗すると、このエラーが発生します。クラスタ内で 1 つ以上のノードがアクティブでないこと、

またはネットワークの問題が原因です。

対処法 :

(i) クラスタ内の他のノードを確認します。稼動しているノードが無い場合は、switchlog を参

照して RMS がこれらのノード上で停止した原因を調べます。

1. 'hvdisp -a'

2. ステップ (a) の出力で、タイプが SysNode であるリソースの状態が、Offline かどうかを調べ

ます。Offline の場合、RMS はそのノード上で稼動していません。

3. Offline 状態のすべてのノードの switchlog を参照して、RMS がそのノード上で稼動していな

い理由を調べます。

(ii) クラスタを構成する他のノードがアクティブの場合は、ネットワークに問題があります。

● (WRP, 41) The interconnect entry <interconnect> specified for SysNode <sysnode> has the same IP address as that of the interface <existinginterconnect>.

<interconnect> と <existinginterconnect> の IP アドレスが同じです。

対処法 :

インタコネクトに異なる IP アドレスが指定されていることを確認してください。

● (WRP, 51) The 'echo' service for UDP may not have been started on the local host. Ensure that the echo service is enabled.

UDP の echoサービスがローカルノード上で有効になっていない可能性があります。

対処法 :

echoサービスが有効になっていること、および起動されていることを確認してください。

204 J2UZ-5294-06Z0(03)

Page 213: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

9 付録 — 通知メッセージ

この章では、switchlog に現れる RMS 通知メッセージの一部を抜粋して説明します。一般的に RMS 通知は、クラスタ内で行われる通常の処理を随時そのまま報告するメッセージであるため、特に説明を付け加える必要はありません。この章では、追加の説明が必要な通知メッセージを選択して収録しました。なお、記載された対処法には省略してもかまわないものも含まれています。

また一部のメッセージには、斜体 ( イタリック ) のテキストが含まれています。これらの斜体部分はプレースホルダであり、エラーメッセージが出力される場合には、実際の値、名称、文字列に置き換えられます。

RMS エラーコードの説明

各メッセージのプリフィックスには、問題を検出した RMS コンポーネントを示すエラーコードとメッセージ番号が含まれています。このプリフィックスは、必要に応じて問題の診断にあたる当社技術員 (SE)に提供してください。以下にエラーコードとそれに関連するコンポーネントを示します。

9.1 ADC: Admin 構成

● (ADC, 22) Attempting to clear the cluster Wait state for SysNode <sysnode> and reinitialize the Online state.

シャットダウン機構が <sysnode> の終了に失敗したため、ノードの状態は Onlineに戻されます。RMS は、黙示的な hvutil -o によって、指定された SysNode の Wait 状態を解除しようとしています。

対処法 :

ログを確認して、SF の終了が失敗した原因を突き止めてください。

9.2 BM:BM ( ベースモニタ )

● (BM, 27) Application <userapplication> does not transition to standby since it has one or more faulted or cluster exclusive online resources.

少なくとも 1 つのリソースが Faulted または ClusterExclusive であるため、アプリケーションでStandby 処理がスキップされます。

対処法 :

ログファイルで問題が発生したリソースがないかどうかを確認し、問題があれば解決してください。問題がなければ、それ以上対処する必要はありません。

● (BM, 84) The RMS-CF-CIP mapping in <configfilename> for SysNode name <sysnode> has found the CF name to be <cfname> and the CIP name to be <cipname>, previously defined as <olscfname>.

ADC: Admin 構成

BM: BM

SWT: 切替要求 (hvswitchコマンド )

SYS: SysNodeオブジェクト

US: usファイル

WRP: ラッパ

J2UZ-5294-06Z0(03) 205

Page 214: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

SWT: 切替え要求 (hvswitch コマンド ) 付録 — 通知メッセージ

CIP データベースの変更が原因で、SysNode名が別の CF 名に割り当てられています。

対処法 :

CIP データベースに問題がなければ、対処する必要はありません。CIP データベースに問題が

ある場合は、データベースを修正し、RMS を再起動してください。

9.3 SWT: 切替え要求 (hvswitch コマンド )

● (SWT, 48) A controller-requested switchover for the application <app> is attempted even though <hostname>, where it used to be Online, is unreachable. The RMS secure mechanism has been overriden with the forced switch option ('hvswitch -f'), and the switch request is processed. If that host is in the Wait state, the switchover is delayed until that host becomes Online, Offline, or Faulted.

<app> は、以前はノード <hostname> 上で Online になっていましたが、現在は <hostname> に接続できず、hvswitch -fが起動されたため、<app> はローカルノードに切替えられます。

対処法 :

対処する必要はありません。

● (SWT, 49) Application <app> will not be switched Online on host <oldhost> because that host is not Online. Instead, it will be switched Online on host <newhost>.

アプリケーション <app> の優先順位スイッチ (hvswitch -p) が起動されましたが、次の優先順位のノード <oldhost> が Online になっていないため、アプリケーションは <newhost> に切替えられます。

対処法 :

対処する必要はありません。

9.4 SYS:SysNode オブジェクト

● (SYS, 12) Although host <hostname> has reported online, it does not respond with its checksum. That host is either not reachable, or does not have the local host <localhost> in its configuration. Therefore, it will not be brought online.

ノード <hostname> が Online であると通知されますが、そのチェックサムが通知されていません。原因として、ローカルノードから接続不能であるか、ローカルノードが構成に含まれていないことが考えられます。

対処法 :

ログファイルと構成を確認して、<hostname> からチェックサムが通知されない原因を突き止め

てください。

206 J2UZ-5294-06Z0(03)

Page 215: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 通知メッセージ US:us ファイル

9.5 US:us ファイル

● (US, 7) <object>: Transitioning into a Faulted state according to persistent fault info.

以前のRMSの動作が原因でPersistentFault属性が<object>に設定され、リソースがFaultedに設定されています。

対処法 :

対処する必要はありません。

● (US, 11) Temporary heartbeat failure disappeared. Now receiving heartbeats from cluster host <hostname> again.

一時的なハートビート切れがなくなりました。現在は、<hostname> からハートビートを受信しています。

対処法 :

情報のメッセージのため、対処不要です。

● (US, 40) object: Offline processing due to hvshut finished.

RMS 停止の延長で実行された userApplication<appli> の Offline 処理が終了したことを示します。

対処法 :

対処する必要はありません。

● (US, 41) The userApplication <userapplication> has gone into the Online state after Standby processing.

<userapplication> が Standby状態にならずに Online状態になりました。

対処法 :

対処する必要はありません。

● (US, 44) object: Fault propagation to parent ends here. Reason is either a MonitorOnly attribute of the child reporting the Fault, or the "or" character of the current object

親オブジェクトへの Fault の伝播が <resouce > で終了しました。理由は、Fault を報告した子リソースが MonitorOnly 属性であるからか、現在のオブジェクトが "or" オブジェクトであるためです。

対処法 :

対処する必要はありません。

● (US, 56) The userApplication <userapplication> is already Online at RMS startup time. Invoking an Online request immediately in order to clean up possible inconsistencies in the state of the resources.

RMS の起動時にアプリケーション <userapplication> がすでに Online になっています。通常、この現象は前回の RMS のシャットダウンが正常に終了しなかったことが原因で起こります。さらに不整合が発生しないように、アプリケーションを Online にしました。

対処法 :

対処する必要はありません。

J2UZ-5294-06Z0(03) 207

Page 216: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

WRP: ラッパ 付録 — 通知メッセージ

9.6 WRP: ラッパ

● (WRP, 21) A message cannot be sent into a Unix message queue from the process <pid>, <process>, after <number> attempts in the last <seconds> seconds. Still trying.

プロセス <pid>、<process> による <number> 回の試行後、 後の <seconds> 秒間で、キューが満杯またはビジー状態であるため、メッセージを UNIX キューに送ることができませんでした。

対処法 :

msgmnbや msgtqlなど、システムメッセージキューの調整可能な値を確認し、必要に応じて

値を増やしてから再起動してください。

● (WRP, 22) A message cannot be sent into a Unix message queue id <queueid> by the process <pid>, <process>.

UNIX メッセージキューによる RMS プロセス間の通信に失敗しました。

対処法 :

msgmnbや msgtqlなど、システムメッセージキューの調整可能な値を確認し、必要に応じて

値を増やしてから再起動してください。

● (WRP, 26) Child process <cmd> with pid <pid> has been killed because it has exceeded its timeout period.

タイムアウト時間を経過したため、子プロセス <cmd> が親プロセスで終了されています。

対処法 :

対処する必要はありません。

● (WRP, 27) Child process <cmd> with pid <pid> will not be killed though it has exceeded its timeout period.

プロセス <cmd> がタイムアウト時間を過ぎても終了しません。

対処法 :

対処する必要はありません。

208 J2UZ-5294-06Z0(03)

Page 217: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

10 付録 — オペレーティングシステムエラー番号

一部の RMS エラーメッセージでは、オペレーティングシステムエラー番号 <errno> が表示されます。これは、ディテクタやスクリプトの処理が失敗した場合に返される番号です。 エラー番号は問題を診断する際に重要な手がかりとなる場合があります。 該当するオペレーティングシステムのユーザマニュアルやヘッダファイルを参照してください。

J2UZ-5294-06Z0(03) 209

Page 218: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — オペレーティングシステムエラー番号

210 J2UZ-5294-06Z0(03)

Page 219: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

11 付録 — 状態

11.1 基本状態

表 5 はディテクタが BM ( ベースモニタ ) に通知する状態の一覧です。

表 6 は、Cluster Admin GUI または hvdispコマンドで表示される資源の状態の一覧です。

Offline および Faulted の意味は、資源によって異なる場合があります。たとえば、マウントポイントの資源の状態は、Online ( マウントされている ) または Offline ( マウントされていない ) のいずれかです。この場合、ディテクタから Faulted状態が通知されることはありません。他方、物理ディスクのディテクタからは、Online ( 正常動作 ) または Faulted ( 入力または出力のエラー ) が通知され、Offlineが通知されることはありません。

状態 説明

Faulted 監視しているオブジェクトが故障している状態。子のいずれかにおいて、またはスクリプトの実行中に、資源のエラーが発生した可能性があります。

Offline 監視しているオブジェクトが停止している状態。スクリプトにより、資源の非活性化が正しく行われた場合です。

Online 監視しているオブジェクトが起動している状態。必要なすべての子が Online で、かつ、スクリプトの実行中にエラーが検出されなかった場合です。

Standby 監視しているオブジェクトの起動準備が完了している状態。

表 5: RMS オブジェクトのディテクタが通知する状態

状態 説明

Deact 監視しているオブジェクトが保守などの目的で非活性の状態。

Inconsistent 監視しているオブジェクトに一貫性がない状態 (userApplication のみ )。監視しているオブジェクトが Offline または Faulted だが、図表中の 1 つまたは 1つ以上のリソースオブジェクトが Onlineまたは Faultedの状態。

OfflineFault 監視しているオブジェクトの故障が回復していない状態。

Unknown オブジェクトに対する監視や制御が行われていない状態。

Wait 監視しているオブジェクトが状態遷移中。

Warning 監視しているオブジェクトは起動しているが一部故障している状態。ただしこの状態は選択された資源についてのみ表示されます。

Maintenance システム管理者の手動操作によって移行する一時的な保守用の状態。アプリケーションの状態は依存オブジェクトと切り離された状態にあります。これにより、たとえばバックアップを行う場合など、親アプリケーションの状態に影響を与えることなく、ファイルシステムを Offlineにすることができます。

保守モードのアプリケーションには、目標状態のマークが付けられます。目標状態とは、保守モードが直ちに終了したと仮定した場合のそのアプリケーションの状態です。保 守モ ード の 目標 状 態は、Maintenance-Online、Maintenance-Offline、および Maintenance-Standbyです。

表 6: RMS オブジェクトのその他の状態

J2UZ-5294-06Z0(03) 211

Page 220: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

状態の詳細 付録 — 状態

11.2 状態の詳細

上記の基本状態の他に、RMS は以下の場所に状態の詳細を報告する場合があります。

● Cluster Admin GUI では、オブジェクトのプロパティ画面で、リストの一番上に [State Details] 項目が表示されます。ほとんどの属性は RMS Wizard Tools による構成設定処理時で設定されますが、この通知フィールドは RMS の実行時に動的に設定されます。

● hvdispユーティリティの出力では、StateDetails 列が各行の 後に表示されます。

ほとんどの場合、[State Details] フィールドは空白です。RMS がこの追加情報を表示するのは、通常、アプリケーションが保守モードにある場合か、オブジェクトが遷移、不整合、または待機の状態にある場合です。表 7 は、RMS オブジェクトの StateDetails 値の一覧です。

たとえば、あるノード上でアプリケーションが Online 状態から保守モードに切り替わった場合、保守モードが終了すると通常は以前の Online状態に復帰します。RMS はこのことを、そのノードの状態詳細フィールドに Online intended と表示することによって表します。アプリケーションが Offlineであったノードでは、RMS は状態詳細フィールドに Offline intendedを表示します。

値 説明

Failed Over Offline処理が成功し切替えが開始された状態。

Faulted Faultedの通知を受信した。

Inconsistent on remote userApplication が複数のノードで Online であるが、ローカルノード上では Onlineでない状態。

Initial Fault RMS が起動された時点で userApplication がすでに Faulted である状態。

Joined クラスタに参入済みであるため SysNodeが Offlineである状態。

Killed kill が成功したため SysNodeが Faultedの状態にある。

Not Joined クラスタに未参入なため SysNodeが Offlineの状態にある。

Offline Offlineの通知を受信した。

Offline Failed Offline処理が失敗した。

Offline Success Offline処理が成功した。

Offline intended 目標状態は Offline。

Online Onlineの通知を受信した。

Online userApplicationが複数のノードで Onlineである状態。

Online !! 目標状態は Onlineだが、いくつかの資源が競合している状態。

Online intended 目標状態は Online。

PreCheckScriptFailed PreCheckScriptが失敗した。

Preserved PreserveState が設定され、Offline 処理が開始されていない状態。

Shutdown 停止中であるため、SysNodeが Faultedの状態にある。

Standby Standbyの通知を受信した。

Standby !! 目標状態は Standbyだが、いくつかの資源が競合している状態。

Standby intended 目標状態は Standby。

Remote Faulted 制御アプリケーションが少なくとも 1 つのノードで Faulted である状態。

Remote Offline 制御アプリケーションがすべてのノードで Standby ではない状態。

表 7: RMS オブジェクトの StateDetails 値

212 J2UZ-5294-06Z0(03)

Page 221: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

12 付録 — オブジェクトタイプ

この章では RMS によって提供され、RMS Wizard Tools によって構成されるすべてのオブジェクトタイプをアルファベット順に説明します。

タイプ 必須属性 説明

andOp HostName (userApplicationオブジェクトの直接の子に対する )

論理AND演算子で子と関連付けられるオブジェクト。 オブジェクトタイプは、子がOnlineの場合Online、子がOfflineの場合 Offlineになります。

controller Resource属性 1 つ以上の userApplicationオブジェクトを制御するオブジェクト。下位互換性確保のため、PCS は、以前のコントローラオブジェクトがすでに構成に存在している場合はサポートします。ただし、現在の gControllerオブジェクトがある場合は、どちらか一方しかサポートされません。

ENV なし クラスタ ( グローバル ) 環境変数が入っているオブジェクト

ENVL なし ノード固有の (ローカル) 環境変数が入っているオブジェクト

gResource – rKind– rName

カスタム ( 汎用 ) オブジェクト。通常は、ファイルシステム、ネットワークインタフェース、またはシステムプロセスなどのシステムリソースを示します。

orOp なし 論理 OR 演算子で子と関連付けられるオブジェクト。オブジェクトタイプは、1つ以上の子が Online の場合は Onlineになります。

SysNode なし クラスタ内のノードを表します。 低1 つ存在する必要があります。userApplicationオブジェクトのみが子として認められます。

userApplication なし 監視対象のアプリケーションを表します。 低 1 つ存在する必要があります。親として 低 1 つの SysNode オブジェクトが必要です。親 SysNode にはそれぞれ、その SysNodeの名前を HostName属性に持つ子 andOpが 1 つ必要です。

J2UZ-5294-06Z0(03) 213

Page 222: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — オブジェクトタイプ

214 J2UZ-5294-06Z0(03)

Page 223: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

13 付録 — 属性

RMS の属性には、ユーザがウィザード GUI を使用して設定できる属性と、ウィザードがプログラム内で設定する属性の 2 つがあります。以下のセクションでは、すべての属性の設定値について説明します。初期値は各リソースにより異なります。

13.1 ユーザ設定属性

このセクションに記載された属性は、ユーザがウィザード GUI または hvattrコマンドを使用して変更することができます。

● AlternateIp

設定値 : 任意のインタコネクト名

すべての SysNode オブジェクトに対して有効な属性。SysNode 名に割り当てられたインタコネクトが使用不能になった場合に、RMS が追加のクラスタインタコネクトとして使用するスペース区切りリスト。これらのすべてのインタコネクトが /etc/hostsデータベースに登録されていなければなりません。RMS 構成ウィザードはデフォルトで、ノード <nodename> への代替インタコネクトが、<nodename>rmsAI<nn> の形式 (<nn> はゼロパディングされた 2 桁の数 ) の名前を持つことを前提としています。この設定はごく限られた構成に適用されます。CF のクラスタでインタコネクトとして使用しないでください。

● AutoRecover

設定値 : 0、1

リソースオブジェクトに対して有効な属性。1に設定すると、Online状態のオブジェクトで障害が発生した場合に、そのオブジェクトに対して Online スクリプトを実行します。オブジェクトが Online状態に戻ることができる場合は、障害が復旧されます。

Controller オブジェクトはこの属性を 0 に設定する必要があります。 RMS は、子アプリケーションの切替えを自動的に行います。

● AutoRecoverCleanup

設定値 : 0、1

Controllerオブジェクトに対して有効な属性。 この属性を 1 に設定して、AutoRecoverを 1 にしたときは、子アプリケーションで障害が発生した場合、そのアプリケーションは Offline になってから回復します。 この属性を 0 に設定して、AutoRecover を 1 にしたときは、子アプリケーションで障害が発生した場合、そのアプリケーションは Offlineにならずに回復します。

● AutoStartUp

設定値 : 0、1

userApplication オブジェクトに対して有効な属性。 1 に設定すると、RMS 起動時、 も優先度が高い SysNode (PriorityList 属性の 1 番目のノード ) 上でアプリケーションが自動的にOnlineになります。 も優先度が高い SysNodeが使用できないと、別のノードが使用できる状態であっても、アプリケーションは自動的に起動しません。

RMS 環境変数 HV_AUTOSTARTUP を設定して、すべての userApplication オブジェクトのAutoStartUp属性をオーバーライドできます。 HV_AUTOSTARTUPについては、228ページの"14.3RMS ローカル環境変数 " を参照してください。

● AutoSwitchOver

設定値 : 次のうちの 1 つ以上を含む文字列。No、HostFailure、ResourceFailure、ShutDown

userApplicationオブジェクトで障害が発生した場合に、自動的に切替えられるようにします。[|] を使用して、値を組み合わせることができます。Noを指定すると自動切替えは停止します。Noは他の値と組み合わせることができません。

J2UZ-5294-06Z0(03) 215

Page 224: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

ユーザ設定属性 付録 — 属性

下位互換性を確保するため、0 および 1 を使用することができます。0 は No として、1 はHostFailure | ResourceFailure | ShutDownとして扱われます。

● ClusterExclusive

設定値 : 0、1

リソースオブジェクトに対して有効な属性。1 に設定すると、クラスタ内で一度に 1 つのノード上だけでリソースが Online になります。0 に設定すると、一度に複数のノード上でリソースがOnlineになることができます。ここで言う Online とは、オンライン処理のすべてのフェーズを表します。たとえば、リソースがあるノード上でOnline状態にあり、同時にPreOnlineScriptが他のノードで実行中である場合、これらのリソースオブジェクトは両方とも、オンラインであると見なされます。

この属性をユーザが変更できるのは、cmdlineサブアプリケーションについてのみです。他のサブアプリケーションに関しては、構成設定ツールが制御します。

● ControlledSwitch

設定値 : 0、1

制御対象の userApplicationオブジェクトに対して有効な属性。 0に設定すると、RMS は CLIまたはGUIからの手動の切替え要求を受け付けます。 1に設定すると、親コントローラのみがユーザアプリケーションに対する切替え要求を発行することができます。

● FaultScript

設定値 : 有効なスクリプト ( 文字 )

すべてのオブジェクトタイプに対して有効な属性。関連するリソースが Faulted状態になったときに実行するスクリプトを指定します。

● Halt

設定値 : 0、1

userApplication オブジェクトに対して有効な属性。 二重障害の発生時にローカルノードの強制停止を制御します。 二重障害とは、アプリケーションの初期障害処理の実行中に 2 つめの障害が発生した場合です。

Halt が 1 に設定され、他のノードでアプリケーションの実行が可能な場合、二重障害が発生すると以下の処理が実行されます。

1. 初に、ローカルノードの RMS が直ちに終了します。

2. 次に、別のノードの RMS がシャットダウン機構を呼び出してローカルノードを強制停止します。

3. 後に、ローカルノードで Onlineだったすべてのアプリケーションと、AutoSwitchOverパラメタで HostFailureを設定したすべてのアプリケーションが、使用できるノードに切替えられます。

注意:あるアプリケーションが Halt属性のすべての条件を満たしている場合でも(AutoSwitchOverの設定、使用可能なノードの追加)、同じノード上で実行されている別のアプリケーションの状態により Halt の動作が妨げられる場合があります。 例えば、別のアプリケーションに使用可能な別のノードがない場合や、AutoSwitchOverの設定が正しく行われていない場合などです。 どちらの場合でも、RMS はローカルノードでの動作を継続します。 これを防ぐためには、別のアプリケーションに追加のノードを割り当て、優先順位リストを調整して、Halt 属性を設定したアプリケーションとのノードの競合を 小限に抑えるようにします。

● I_List

設定値 : スペース区切りの SysNode名リスト

すべての SysNode オブジェクトに対して有効な属性。RMS が追加のクラスタインタコネクトを監視する際に使用するスペース区切りリスト。追加のクラスタインタコネクトはユーザアプリケーションでのみ使用され、PRIMECLUSTER 製品では使用しません。監視されるすべてのインタ

216 J2UZ-5294-06Z0(03)

Page 225: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 属性 ユーザ設定属性

コネクトが /etc/hosts データベースに登録されていなければなりません。また、すべてのSysNodeオブジェクトが同数の追加インタコネクトを持っていなければなりません。デフォルト値はありません。

● LieOffline

設定値 : 0、1

すべてのリソースオブジェクトに対して有効な属性。1に設定すると、Offline処理中にリソースを Onlineに保つことができます。

● MonitorOnly

設定値 : 0、1

リソースオブジェクトに対して有効な属性。1 に設定すると、親の状態を計算するときに、親がオブジェクトの状態を無視します。すべての親は、MonitorOnly が設定されていない子を 1 つ以上持つ必要があります。

● OfflineScript

設定値 : 有効なスクリプト ( 文字 )

SysNodeを除くすべてのオブジェクトタイプに対して有効な属性。関連するリソースを Offline状態にするときに実行するスクリプトを指定します。

● OnlinePriority

設定値 : 0、1

userApplication オブジェクトに対して有効な属性。全クラスタを停止して再起動した場合に、RMS が、アプリケーションを、 後に Online であったノード上で起動するかどうかを指定します。0に設定された場合や何も設定されていない ( デフォルト ) 場合、アプリケーションは属性 PriorityListで も優先順位の高いノードで Onlineになります。1 に設定すると、アプリケーションは 後に Online であったノード上で Online になります。AutoStartUp または優先切替えの場合、この 後の Online ノードが、優先順位リスト内での位置に関係なく、 高の優先順位になります。RMS は、timestampを参照して、userApplicationが 後に Onlineであったのはどこかを追跡します。userApplicationについて 新の timestampを持つノード上で、userApplicationが Onlineになります。異なるクラスタノード間では、通常時間の同期が実行されますが、実行されない場合もあります。RMS は、クラスタ内のノード間の時間同期を確保する機構を備えていないため、システム管理者が管理する必要があります。RMSによりクラスタ内のノード間で著しい時間の不一致が発見された場合は、switchlogにエラーメッセージが記録されます。NTPD を使用して、クラスタ内のノードの同期をとることもできます。詳細については、xntpdのマニュアルページを参照してください。OnlinePriority 固定状態情報は、RMS が、 後に Online 状態にあったノードが構成から削除された状態で起動されるとクリアされます。

● OnlineScript

設定値 : 有効なスクリプト ( 文字 )

SysNodeを除くすべてのオブジェクトに対して有効な属性。関連するリソースを OnlineまたはStandby 状態にするスクリプトを指定します。

J2UZ-5294-06Z0(03) 217

Page 226: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

ユーザ設定属性 付録 — 属性

● PartialCluster

設定値 : 0、1

userApplication オブジェクトに設定できる属性です。userApplication の起動時に、userApplicationが動作できるすべてのノードに対し、起動しようとする userApplicationがすでに起動していないかをチェックする処理を実行するかどうかを定義します。

本属性値を 0に設定すると、userApplicationが動作できるすべてのノードが Online状態にならないと、userApplicationは起動しません。

本属性値を 1に設定すると、userApplicationが動作できるすべてのノードが Online状態にならなくても、Online状態であるノードで userApplicationは起動します。

PartialCluster属性を持つローカルの userApplicationは、リモートノードの起動タイムアウトの影響を受けません。アプリケーションはローカルノードでOnlineの状態を維持します。224ページの "14.2 RMS グローバル環境変数 " の HV_AUTOSTART_WAITの説明を参照してください。

● PersistentFault

設定値 : 0、1

userApplication オブジェクトに対して有効な属性。1 に設定すると、userApplication はFaulted状態だったかどうかを追跡します。 RMS を停止して再起動した場合、hvutil -cまたは hvswitch -fで障害を解消するか、Faulted状態の SysNodeを構成から削除してから RMS を再起動しなければ、Faulted状態だった userApplicationは Faulted状態に戻ります。

● PostOfflineScript

設定値 : 有効なスクリプト ( 文字 )

SysNodeを除くすべてのオブジェクトに対して有効な属性。関連するリソースの状態が Offlineに変化した後で実行するスクリプトを指定します。

● PostOnlineScript

設定値 : 有効なスクリプト ( 文字 )

SysNodeを除くすべてのオブジェクトに対して有効な属性。関連するリソースの状態が Onlineまたは Standby に変化した後で実行するスクリプトを指定します。

● PreOfflineScript

設定値 : 有効なスクリプト ( 文字 )

SysNode を除くすべてのオブジェクトに対して有効な属性。関連するオブジェクトの状態がOffline状態にする前に実行するスクリプトを指定します。

● PreOnlineScript

設定値 : 有効なスクリプト ( 文字 )

SysNodeを除くすべてのオブジェクトに対して有効な属性。関連するリソースを OnlineまたはStandby 状態にする前に実行するスクリプトを指定します。

● PreserveState

設定値 : 0、1

userApplication オブジェクトに対して有効な属性。1 に設定すると、障害発生後にリソースをOffline にしません。AutoSwitchoverが1に設定されている場合、この属性は無視されます。

● PriorityList

設定値 : 有効な SysNode名のリスト ( 文字 )

userApplicationオブジェクトに対して有効な属性。アプリケーションが Onlineになることができる SysNodeオブジェクトのリストが入っています。リスト内の順序によって、優先手動切替え時の次のアプリケーション切替え先ノードが決まり、Fault後の手動切替え順序が決まりま

218 J2UZ-5294-06Z0(03)

Page 227: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 属性 ユーザ設定属性

す。リストは循環して適用されます。アプリケーションのノードを選択すると、それに伴ってこの属性が指定されます。RMS はノードが選択された順序を採用して、PriorityList を自動的に作成します。ノードリスト内の各ノードを選択することにより、順序を変更することができます。ローカルgControllerオブジェクトまたはcontrollerオブジェクトで制御されたアプリケーションでは、PriorityListのノードの順番は無視されます。ただし、それぞれの制御対象アプリケーションは、controllerオブジェクトに指定されているノード上で実行できなければなりません。

● Resource

設定値 : 有効な名前 ( 文字 )

Controller オブジェクトに対して有効な属性。 子(制御対象)ユーザアプリケーションの名前を含みます。

● ScriptTimeout

設定値 : 0-MAXINT (秒数)または "timeout_value[:[offline_value][:online_value]]" 形式の有効な文字列

すべてのオブジェクトタイプに対して有効な属性。構成定義ファイルでノードに対して指定したすべてのスクリプトのタイムアウト値を指定します。このタイムアウト時間が経過すると、RMSはスクリプトに対して停止信号を送信します。

OfflineScriptの offline_value タイムアウト値と OnlineScriptの online_value タイムアウト値は、それぞれこの文字列の形式で指定します。

● ShutdownPriority

設定値 : 0-MAXINT

userApplicationオブジェクトに割り当てられた重み係数。インタコネクト故障が発生した場合に生成されるサブクラスタの強制停止の優先度を決定します。

インタコネクト故障が発生して、ノードの強制停止要求が生成されると、SF は各サブクラスタのSF ノードの重みと、サブクラスタ内の全 Onlineアプリケーションの RMS ShutdownPriorityを合算して、各サブクラスタの優先順位を算出します。ノードがインタコネクトによって相互に結合されているサブクラスタが、 も大きな重み係数を持ち、強制停止する優先順位が も低くなります。各サブクラスタの重みは、SF ノードの重みに、サブクラスタ内で Online状態にあるすべての userApplication オブジェクトの RMS ShutdownPriority の値を加えた合計値です。

● StandbyCapable

設定値 : 0、1

リソースオブジェクトに対して有効な属性。1に設定すると、対応する親 userApplicationがOfflineであるすべてのノード上で、Standby処理が実行されます。

この属性をユーザが変更できるのは、cmdlineサブアプリケーションについてのみです。他のサブアプリケーションに関しては、構成設定ツールが制御します。

● StandbyTransitions

設定値 : StartUp、SwitchRequest、ClearFaultRequest、または、縦線 (|) で結合される任意の組合せ

userApplication オブジェクトに対して有効な属性。この値は、userApplication オブジェクトについて、Standbyプロセスがいつ開始されるかを指定します。

– StartUpは、起動時を指定します。 この設定は、実際のアプリケーションがすでにオンラインになっている場合や、AutoStartUp 属性が設定されているため、userApplicationオブジェクトが強制的に Online化される場合には無視されます。

– SwitchRequestは、切替えの後、切替え前に Onlineであった userApplicationオブジェクトを Standby状態に移行させます。

J2UZ-5294-06Z0(03) 219

Page 228: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

RMS 構成ウィザード管理属性 付録 — 属性

– ClearFaultRequestは、hvutil -cにより Faulted状態がクリアされたuserApplicationを Standby状態に移行させます。

● WarningScript

設定値 : 有効なスクリプト ( 文字 )

ディテクタを持つリソースオブジェクトに対して有効な属性。関連するリソースの状態がWarningになった後で実行するスクリプトを指定します。

13.2 RMS 構成ウィザード管理属性

このセクションに記載された属性は、RMS 構成ウィザードによりプログラム内で設定されています。

● Affiliation

設定値 : 任意の文字列

リソースオブジェクトに対して有効な属性。RMS 内では、機能的な意味はありません。

● Class

設定値 : 任意の文字列

SysNodeを除くすべてのオブジェクトに対して有効な属性。リソースオブジェクトのクラスを示します。他のプログラム (SNMP エージェントなど ) によってさまざまな目的で使用されます。この値は、RMS ウィザードによって指定されます。

● Comment

設定値 : 任意の文字列

すべてのオブジェクトに対して有効な属性。RMS では、機能的な意味はありません。

● DetectorStartScript

設定値 : 任意の有効なディテクタ

ディテクタを持つリソースオブジェクトに対して有効な属性。<configname>.us ファイルでディテクタ起動コマンドを直接指定します。

なお、RMS は状態を内部的に決定するため、Controllerオブジェクトにはディテクタがありません。

● HostName

設定値 : 任意の SysNode名

userApplicationオブジェクトの第 1レベルの子であるandOpオブジェクトだけに設定する値です。これらの andOpオブジェクトは、HostName属性で指定された SysNodeに自分の親アプリケーションを関連付け、さらにアプリケーションに対するノードの優先順位も決定します。

● LastDetectorReport

設定値 : Online、Offline、Faulted、Standby

ディテクタを持つリソースオブジェクトに対して有効な属性。この属性には、ディテクタから通知された 新のオブジェクトの状態が含まれています。この値は通常、Cluster Admin GUI に表示されます。表示される値はオブジェクトが表している資源のタイプによって異なります。

● MaxControllers

設定値 : 0-512

userApplication オブジェクトに対して有効な属性。指定した子アプリケーションの親userApplicationオブジェクトの 大数。

220 J2UZ-5294-06Z0(03)

Page 229: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 属性 RMS 構成ウィザード管理属性

● NoDisplay

設定値 : 0、1

すべてのオブジェクトタイプに対して有効な属性。1に設定すると、hvdispがアクティブなときに、リソースが表示されません。hvdisp -Sで、この設定を無効にすることができます。

● NullDetector

設定値 : on、off

ディテクタを持つリソースオブジェクトに対して有効な属性。NullDetector を on に設定すると、ディテクタが実行時に無効になります。この属性は動的再構成でのみ使用します。RMS 構成定義ファイルで、NullDetectorを onにハードコード化してはいけません。

● OfflineDoneScript

設定値 : 有効なスクリプト ( 文字 )

userApplication オブジェクトに対して有効な属性。userApplicationの Offline 処理が完了した後で実行する 後のスクリプト。

● PreCheckScript

設定値 : 有効なスクリプト ( 文字 )

userApplication オブジェクトに対して有効な属性。Online または Standby 処理中に 初のアクションとしてフォークされるスクリプトを指定します。スクリプトの終了コードとして 0が戻ると、処理が実行されます。スクリプトの終了コードとして 0 以外の値が戻ると、処理が実行されず、適切な警告が switchlogファイルに記録されます。

● rKind

設定値 : 0-2047

gResourceタイプのオブジェクトに対するディテクタの種類を指定します。

● rName

設定値 : 有効な名前 ( 文字 )

gResourceオブジェクトに対して有効な属性。汎用ディテクタに転送される文字列を指定します。

● SplitRequest

設定値 : 0、1

controllerオブジェクトに対して有効な属性。1に設定すると、Offline要求および Online要求とは別に、PreOffline 要求と Preonline 要求が、子 userApplicationに伝播します。0に設定すると、子 userApplicationに対して PreOffline要求または PreOnline要求が発行されません。

● StateDetails

設定値 : 任意の文字列

すべてのオブジェクトに対して有効な属性。 Cluster Admin GUI または hvdisp CLI ユーザインタフェース内に状態の詳細情報を追加表示します。 ほとんどの場合、[StateDetails] フィールドは空白です。 RMS がこの追加情報を表示するのは、通常、アプリケーションが保守モードにある場合か、オブジェクトが遷移、不整合、または待機の状態にある場合です。

J2UZ-5294-06Z0(03) 221

Page 230: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

RMS 構成ウィザード管理属性 付録 — 属性

222 J2UZ-5294-06Z0(03)

Page 231: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

14 付録 — 環境変数

この章では、RMS のすべての環境変数を以下のグループに分けて説明します。

● 224 ページの "14.2 RMS グローバル環境変数 " では、RMS グローバル環境変数について説明しています。

● 228ページの"14.3 RMSローカル環境変数" では、RMS ローカル環境変数について説明しています。

● 230 ページの "14.4 RMS スクリプト実行環境変数 " では、RMS スクリプト実行環境変数について説明しています。

14.1 RMS 環境変数の設定

hvenv構成設定ファイルの変更は行わないでください。構成設定の RMS 環境変数を変更する際には必ず、hvenv.localファイルに行ってください。

RMS 環境変数の値は、hvenv.localファイルで指定されています。RMS 環境変数の設定を変更するには、テキストエディタで hvenv.localを開き、必要に応じて行の編集または追加を行います。

RMS 環境変数の値は通常次のように記述されています。

export SCRIPTS_TIME_OUT=200

RMS は起動時に一度だけ、hvenvおよび hvenv.localから RMS 環境変数の値を読取り、各ノードでENVオブジェクトと ENVLオブジェクトを初期化します。これ以降 RMS は、ENVオブジェクトと ENVLオブジェクトのファイルを参照しません。このため hvenv.localに加えた変更は、RMS の次回起動時まで有効になりません。

ENVL ( ローカル ) オブジェクトの値は ENV ( グローバル ) オブジェクトの値より優先されます。hvenv.local ファイルに RMS グローバル環境変数が設定された場合は、対応する hvenv ファイルの設定は上書きされます。ただし、RMS グローバル環境変数の設定はクラスタ全体で同じでなければならないため、1 つのノードで hvenv.localファイルの RMS グローバル環境変数の設定を変更した場合は、残りの全ノードで同じように hvenv.localを変更してください。

RMS の実行中は、hvdisp コマンドで RMS 環境変数を表示することができます。ルート権限は必要ありません。

● hvdisp ENV

● hvdisp ENVL

J2UZ-5294-06Z0(03) 223

Page 232: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

RMS グローバル環境変数 付録 — 環境変数

14.2 RMS グローバル環境変数

RMS グローバル環境変数 (ENV) の設定は、クラスタシステムで共通な構成定義のチェックサムでも検証されます。チェックサムは BM ( ベースモニタ ) の起動時に各ノードで検証され、いずれかのノードでチェックサムが異なっていると、RMS の起動は失敗します。

RMS 環境変数のデフォルト値は、<RELIANT_PATH>/bin/hvenvで調べることができます。hvenv.local構成設定ファイルで RMS 環境変数を再定義することができます。

このセクションでは、RMS グローバル環境変数について説明します。

● HV_AUTOSTARTUP_IGNORE

設定値 : RMS クラスタノードのリスト。RMS クラスタノードのリスト内のノード名は、RMS 構成定義ファイルに記載された SysNodeの名前であることが必要です。リストに CF 名を含めることはできません。デフォルト : "" ( 未設定 )

RMS の起動時に無視されるクラスタノードのリスト。デフォルトでは、RMS 環境変数は設定されません。AutoStartUp 属性を設定してあり、ユーザアプリケーションで定義されているすべてのクラスタノードが Online を報告すると、ユーザアプリケーションが自動起動処理を開始します。クラスタノードがこのリストに含まれている場合は、このノードが Online 状態を報告していなくても、自動起動処理が開始されます。

1 つ以上のクラスタノードを一定期間クラスタから削除する必要があり、削除されたクラスタノードを指定する構成定義ファイルを RMS が使用し続ける場合に、RMS 環境変数を使用します。この場合、RMS 環境変数で使用不能なクラスタノードを指定すると、使用不能なクラスタノードがOnlineを報告しなくても、すべてのユーザアプリケーションが自動的にオンラインになります。

RMS 環境変数を使用する場合は、すべてのクラスタノード上で正しく定義し、常に 新の値に設定する必要があります。ノードをクラスタに戻すときは、RMS 環境変数からそのノードを削除します。ノードを RMS 環境変数から削除しないと、RMS は起動処理中にこのノードを無視し、このリストで指定されているノードでアプリケーションが稼動しているかどうかをチェックしないので、データが失われる場合があります。RMS 環境変数を使用する場合は、システム管理者がこのリストを 新の状態に保つ必要があります。

● HV_AUTOSTART_WAIT

設定値 : 0 - MAXINTデフォルト : 60 ( 秒 )

RMS の起動時にクラスタノードが Online を報告するまでの待ち時間を ( 秒数で ) 指定します。この時間が過ぎて、すべてのクラスタノードがオンラインにならないと、Online を報告しないクラスタノード、およびユーザアプリケーションを自動的に起動できない理由が、switchlogメッセージによって報告されます。

PartialCluster属性を持つローカルの userApplicationは、リモートノードのHV_AUTOSTART_WAITタイムアウトの影響を受けません。アプリケーションはローカルノードで Onlineの状態を維持します。215 ページの "13.1 ユーザ設定属性 " の PartialCluster属性の説明を参照してください。

224 J2UZ-5294-06Z0(03)

Page 233: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 環境変数 RMS グローバル環境変数

この属性は警告メッセージです。AutoStartUpは、指定された時間の経過後も処理を継続します。

● HV_CHECKSUM_INTERVAL

設定値 : 0 - MAXINTデフォルト : 120 ( 秒 )

各 Online ノードのチェックサムとローカルチェックサムが同じであると確認されるまで RMSBM ( ベースモニタ ) が待つ時間 ( 秒数 )。

この時間内にチェックサムが確認されると、ローカルノード上の RMS が通常どおり動作し続けます。一方、リモートノードのチェックサムが確認されない場合、または異なるチェックサムが確認された場合、HV_CHECKSUM_INTERVAL の今回の待機時間中に起動されたローカルモニタはシャットダウンします。

また、リモートノードのチェックサムが確認されない場合、または異なるチェックサムが確認された場合、HV_CHECKSUM_INTERVALの今回の待機時間より前に起動されていたローカルモニタはこのリモートノードを Offlineと認識します。

● HV_COM_PORT

設定値 : 0 - MAXINTデフォルト : 8000

RMS ベースモニタがクラスタの全ノードと通信する場合に使用するポート。

● HV_LOG_ACTION_THRESHOLD

設定値 : 0 - 100デフォルト : 98

hvlogcontrolが RMS ログファイルを消去する条件を指定します。 RELIANT_LOG_PATH が存在するファイルシステム上で、使用済み容量のパーセントがこのしきい値以上になった場合は、RELIANT_LOG_PATH のサブディレクトリはすべて削除されます。 さらに HV_LOG_ACTION が onに設定されている場合に、すべてのサブディレクトリの削除が完了すると、現在のログファイルも削除されます。 詳細については、228 ページの “HV_LOG_ACTION” を参照してください。

● HV_LOG_WARN_THRESHOLD

設定値 : 0 - 100デフォルト : 95

RMS ログファイルの容量につき、hvlogcontrol がどの時点で警告を表示するかを指定します。RELIANT_LOG_PATH が存在するファイルシステム上で、使用済み容量のパーセントがこのしきい値以上になった場合、hvlogcontrol がユーザに警告を発します。上記HV_LOG_ACTION_THRESHOLDも参照してください。

J2UZ-5294-06Z0(03) 225

Page 234: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

RMS グローバル環境変数 付録 — 環境変数

● HV_LOH_INTERVAL

設定値 : 0 - MAXINTデフォルト : 30

userApplication が 後に Online 状態であったノード (LOH:Last Online Host) を特定するために、タイムスタンプを比較する際の、 小時間差 ( 秒数 ) を指定します。本設定は OnlinePriority属性に 1 が設定されている場合に使用されます。

2 つのクラスタノードにおけるそれぞれの userApplication に記録された LOH タイムスタンプを比較して、その差がこの属性で指定する時間よりも小さかった場合、RMS は自動起動せず、優先順位の変更は行われません。この場合はコンソールにメッセージを送信し、オペレータ介入が必要になります。

この値を設定する場合は、そのクラスタ内部での時刻同期精度を考慮に入れる必要があります。クラスタノード間で発生しうる時間差よりも大きい値を指定してください。

● HV_USE_ELM

設定値 : 0、1デフォルト : 1

RMS ベースモニタによるハートビート監視モードを指定します。

0-リモートノードとベースモニタの状態は、ネットワークを通じて UDP ハートビートパケットを定期的に送信することにより検出されます。HV_CONNECT_TIMEOUT で定義した間隔内にリモートノードからのハートビートが受信されなかった場合、リカバリ期間の経過を待ってからノード停止処理を開始します。

1 - ELM (Enhanced Lock Manager) と UDP ハートビート方式を組み合わせて使用します。この設定は、CF がインストールされ構成設定が完了している場合にのみ有効です。ELM のロックは、ローカルノードによって取得され、ELM がリモートノードまたはベースモニタの DOWN 状態を通知するまで、ローカルノードにより保存されます。リモートノードまたはベースモニタのDOWN状態が通知されたノードは直ちに停止されます。ELM がリモートノードの状態に変化があったことを通知すると、RMS は各ノードの UDP ハートビートの監視を開始します。監視の方法は上記と同様ですが、リカバリタイムアウト時間はかなり長く設定されます。

ELM が起動されているかどうかにかかわらず、UDP ハートビートが、ハートビートリカバリタイムアウト期間終了前に受信されなければ、リモートノードは停止されます。CF が起動されていない場合、ELM は自動的に停止され、ハートビートリカバリタイムアウトのデフォルト値が 45 秒に設定されます。CF が起動されている場合は、ELM がデフォルトで起動され、ハートビートリカバリタイムアウトのデフォルト値は、600 秒に設定されます。これにより、リモートノードの応答が遅い場合でも、ノードの途中停止を避けることができます。

ELM の手動停止は、専門知識がある場合にのみ行ってください。CF が起動された状態で ELM が停止している場合、ハートビートタイムアウトをデフォルト値の 600 秒で使用すると、間隔が長すぎてリモートの RMS やノードの停止が効率的に検出できません。この場合には、ローカルノードのリカバリタイムアウト値も手動で調整する必要があります。調整するには、hvcm -h<timeout> -c <config_file> コマンドで RMS を起動します。リカバリタイムアウトの設定値は、クラスタ内の全ノードで同じにする必要があります。ELM が停止されている場合の推奨グローバル値は 45 秒です。

● RELIANT_LOG_LIFE

設定値 : 任意の日数デフォルト : 7 ( 日 )

RMS ログ情報が保持される日数を指定します。RMS を起動するたびに、RMS を 後に起動した時刻に基づく名前のディレクトリが作成されます。このディレクトリに、すべてのログファイルが入ります。すべての RMS ログファイルはこの方法で保持されます。この RMS 環境変数で指定した日数より古いログファイルは cronジョブで削除されます。

226 J2UZ-5294-06Z0(03)

Page 235: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 環境変数 RMS グローバル環境変数

● RELIANT_LOG_PATH

設定値 : 任意の有効なパスデフォルト : /var/opt/SMAWRrms/log

すべての RMS ログファイルと RMS Wizard Tools ログファイルが格納されるディレクトリを指定します。

● RELIANT_PATH

設定値 : 任意の有効なパスデフォルト : /opt/SMAW/SMAWRrms

RMS ディレクトリ階層のルートディレクトリを指定します。通常は、ユーザがデフォルト設定を変更する必要はありません。

● RELIANT_SHUT_MIN_WAIT

設定値 : 0 - MAXINTデフォルト・Solaris : MAXINT ( 秒 )・Linux : 900 ( 秒 )

hvshutコマンドがタイムアウトするまでの時間を秒数で指定します。

hvshutコマンドが -l、-s、-aのいずれかのオプションで実行されると、RMS は起動状態のクラスタアプリケーションのオフライン処理を行った後、RMS の停止処理を行います。

そのため、RELIANT_SHUT_MIN_WAITには、以下を合計した時間を設定してください。

1. クラスタアプリケーションのオフライン処理が終了するのに必要な 大時間

2. RMS が停止するのに必要な 大時間(30 秒)

1. の値には、クラスタアプリケーションに含まれる、すべてのリソースのスクリプトタイムアウト時間の合計値を使用してください。

各リソースのスクリプトタイムアウト時間は、リソース名を引数にした hvdispコマンドの実行により、OfflineScript属性が空でないリソースの ScriptTimeout属性の設定値(秒数)で確認できます。

クラスタアプリケーションが複数存在する場合は、クラスタアプリケーションごとにリソースのスクリプトタイムアウト時間を合計した値のうち、 も大きい値を使用してください。

RELIANT_SHUT_MIN_WAITの値を大きくすることにより、クラスタアプリケーションのオフライン処理の遅延やハングが発生した場合に、以下のような影響があります。

– RMS の停止や OS シャットダウンの処理に、RELIANT_SHUT_MIN_WAITの設定値以上の時間がかかる可能性があります。

– RMS の停止や OS シャットダウンによる、クラスタアプリケーションの自動切替えの処理に、RELIANT_SHUT_MIN_WAITの設定値以上の時間がかかる可能性があります。

RELIANT_SHUT_MIN_WAIT の値が大きすぎる場合は、前述の 1. の値には、想定されるクラスタアプリケーションのオフライン処理がタイムアウトするケースのうち、タイムアウトまでにかかる時間がも長いと見込まれるケースの処理時間を使用してください。

ただし、RELIANT_SHUT_MIN_WAITの値が小さすぎると、クラスタアプリケーションのオフライン処理が終了する前に hvshutコマンドがタイムアウトする現象が頻発するおそれがあります。このため、RELIANT_SHUT_MIN_WAITのチューニングは慎重に行ってください。

J2UZ-5294-06Z0(03) 227

Page 236: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

RMS ローカル環境変数 付録 — 環境変数

hvshutコマンドのタイムアウト時に RMS は異常終了するため、リソースが停止せず起動したままになる場合があります。この状態にて、他のノードで RMS を起動し、クラスタアプリケーションを強制的に起動すると、リソースが複数ノード上で同時に起動している状態となり、リソースで共用ディスクの制御を行っている場合、データ破壊が発生するおそれがあります。このため、hvshut コマンドがタイムアウトした場合は、 RMSが異常終了したノードの OS をシャットダウン、またはノードを強制停止することで確実にリソースを停止させてから、RMSとクラスタアプリケーションを起動してください。

14.3 RMS ローカル環境変数

ローカルの RMS 環境変数の設定はノードごとに異なります。このセクションでは、RMS ローカル環境変数について説明します。

● HV_AUTOSTARTUP

設定値 : 0、1デフォルト : 1(AutoStartUp属性の通常の処理 )

ローカルノード上にある全 userApplication オブジェクトの AutoStartUp 属性を制御します。1 (デフォルト ) に設定すると、各userApplicationの自動起動は、それぞれのAutoStartUp属性によって決まります (215 ページの "13.1 ユーザ設定属性 " を参照 )。0 に設定すると、userApplication に設定された AutoStartUp 属性は無視され、自動起動は行われません。HV_AUTOSTARTUPは、hvsetenvコマンド、または Cluster Admin の [ ツール ] メニューから設定します。いずれに設定した場合でも、変更結果は RMS の次回起動時まで反映されません。

● HV_CONNECT_TIMEOUT

設定値 : 5- MAXINTデフォルト : 30( 秒 )。通常は、ユーザがデフォルト設定を変更する必要はありません。

相手ノードからハートビートがない状態がこの時間 ( 秒数 ) だけ経過すると、ベースモニタはノードとの接続が切断されたと判断し、UDP ハートビートリカバリタイマーを起動します。

5 未満の数値を入力すると、システムによって 5 に変換されます。

● HV_LOG_ACTION

設定値 : on、offデフォルト : off

RELIANT_LOG_PATH ファイルシステム上の使用済み領域が HV_LOG_ACTION_THRESHOLD 以上になった場合に、そのディレクトリにある現在のログファイルが削除されるかどうかを決定します。詳細については、225 ページの “HV_LOG_ACTION_THRESHOLD” を参照してください。

● HV_MAX_HVDISP_FILE_SIZE

設定値 : 0 - MAXINTデフォルト : 20,000,000 ( バイト )

RMS が構成データおよび構成変更と状態変化に関する情報を hvdispに提供するために使用する一時ファイルが、無限に大きくなるのを防止します。この RMS 環境変数の値は一時ファイル<RELIANT_PATH>/locks/.rms<hvdisp プロセスのプロセス ID> の 大サイズ ( バイト数 ) です。

228 J2UZ-5294-06Z0(03)

Page 237: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 環境変数 RMS ローカル環境変数

● HV_MAXPROC

設定値 : 0 - フォーク上限デフォルト : 30

RMS がいつでもフォークできるスクリプトの 大数を定義します。ほとんどの場合は、デフォルト (30) で十分です。

● HV_MLOCKALL

設定値 : 0、1デフォルト : 0

1 に設定するとベースモニタプロセスおよび割り当てたすべてのメモリは、メモリ内でロックされます。0 (デフォルト) に設定すると、ベースモニタはスワップアウトされる場合があります。

● HV_RCSTART

設定値 : 0、1デフォルト : 1 (RMS を rcスクリプトで起動します )

RMS を rcスクリプトで起動するかどうかを決定します。1 ( デフォルト ) に設定すると、RMS はシステムの起動時に、rcスクリプトから自動で起動されます。0 に設定されていると、RMS は手動で hvcmコマンドによって起動する必要があります。HV_RCSTARTは、Cluster Admin の [ ツール ] メニューまたは hvsetenvコマンドで設定できます (rc起動の前提条件 : CONFIG.rmsが存在し、有効なエントリがあること )。

● HV_REALTIME_PRIORITY

設定値 : 0 - 99デフォルト : 50

RMS BM ( ベースモニタ ) とそのディテクタの RT クラス内の優先順位を定義します。この値を設定する場合は注意が必要です。優先順位を高く設定すると、他の OS のリアルタイムプロセスが、プロセッサのタイムスライスを取得できなくなる可能性があります。低く設定すると、RMS BMがディテクタからの通知に反応できなくなったり、コマンドラインユーティリティからの要求を実行できなくなったりする可能性があります。

この変数は Solaris でのみ有効です。 Linux プラットフォーム上では何の効力もありません。

HV_SCRIPTS_DEBUG

設定値 :0、1デフォルト : 0

RMS スクリプトによるデバッグ出力情報を制御します。この変数を 1 に設定すると、Wizard Toolsによって生成され管理されるスクリプトの設定いかんにかかわらず、RMS ファイルに対して実行されたコマンドに関する詳細な実行時情報が書き込まれます。 記録される情報の内容はスクリプトによって異なります。この設定は、PRIMECLUSTER 製品提供のスクリプトにのみ適用されます。スクリプトによるデバッグ情報の記録を停止するには、hvenv.local で HV_SCRIPTS_DEBUG エントリを削除するか、export HV_SCRIPTS_DEBUG=0を指定してください。

注意:この変数が hvenv.localに設定された場合、RMS はこれをスクリプト環境に追加しますが、それ以外の処理はしません。 このため、Cluster Admin GUI および hvdisp ENVL出力には表示されません。

● HV_SYSLOG_USE

設定値 :0、1デフォルト : 1 (hvenvにおける設定 )

RMS BM ( ベースモニタ ) からシステムログへの出力を制御します。RMS は常に、ERROR、FATALERROR、WARNINGおよび NOTICEの各メッセージを switchlogファイルに記録しています。デフォルトでは、これらのメッセージはシステムログファイル (Solaris では /var/adm/messages、Linux では /var/log/messages) にも同時に出力される設定になっています。RMS メッセージのシステムログファイルへの出力を停止するには、hvenv.localで export HV_SYSLOG_USE=0に設定します。

J2UZ-5294-06Z0(03) 229

Page 238: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

RMS スクリプト実行環境変数 付録 — 環境変数

● RELIANT_HOSTNAME

設定値 : 任意の有効な名前デフォルト : < ノード名 >RMS

RMS クラスタ内のローカルノードの名前。RMSサフィックスが付く CF 名 (fuji2RMSなど ) の出力をこの RMS 環境変数に割り当てて、この RMS 環境変数のデフォルト値を定義します。

export RELIANT_HOSTNAME=`cftool -l 2>/dev/null | tail -1 | cut -f1 -d" "`RMS

この事前設定値が適切でない場合は、すべてのクラスタノード上で変更する必要があります。

指定したクラスタノード名は、<configname>.us構成定義ファイル内の SysNode名と一致していなければなりません。ノード名によって、RMS がこのノードとの通信を確立する際に使用する IPアドレスが決まります。

● RELIANT_INITSCRIPT

設定値 : 任意の実行可能スクリプトデフォルト : <RELIANT_PATH>/bin/InitScript

システム起動時に RMS が実行する初期化スクリプトを指定します。このスクリプトは、他のプロセスが起動する前に実行されます。このスクリプトは、それが定義されているすべてのクラスタノード上で 1 度実行されるグローバルスクリプトです。

● RELIANT_STARTUP_PATH

設定値 : 任意の有効なパスデフォルト : <RELIANT_PATH>/build

RMS の起動時に構成定義ファイルを探す場所を定義します。

● SCRIPTS_TIME_OUT

設定値 : 0 - MAXINTデフォルト : 300 ( 秒 )

すべての RMS スクリプトが終了するまでのグローバル時間を ( 秒数で ) 指定します。この RMS 環境変数で定義した時間内に特定のスクリプトを終了できない場合は、スクリプトが失敗したと想定され、RMS がスクリプト失敗に対する適切な処理を開始します。

この値が小さすぎると、エラーが不必要に生成されて、アプリケーションをオンラインまたはオフラインにできない場合があります。また、この値が極端に大きいと、スクリプトの失敗を想定するまでの待ち時間が長くなりすぎます。

このグローバル設定値は、RMS が監視するすべてのオブジェクトについて適切であることが必要です。そうでない場合は、ScriptTimeout 属性のオブジェクト固有の値が代わりに使用されます。

14.4 RMS スクリプト実行環境変数

本セクションの RMS 環境変数は、RMS ベースモニタが該当オブジェクトのスクリプトを実行するときに、RMS によって自動的に設定されます。これらの RMS 環境変数はスクリプトの環境下にのみ存在し、かつ、スクリプト実行の間のみ存在します。また、明示的に設定されるため、デフォルト値はありません。

● HV_APPLICATION

設定値 : 任意の userApplication名

現在のオブジェクトを含むサブツリーの 上位にあるuserApplicationオブジェクトの名前です。

● HV_AUTORECOVER

設定値 : 0、1

230 J2UZ-5294-06Z0(03)

Page 239: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — 環境変数 RMS スクリプト実行環境変数

1 に設定されている場合、スクリプトの呼び出しが AutoRecover の試行に起因することを示します。

● HV_FORCED_REQUEST

設定値 : 0、1

1 に設定されている場合、現在スクリプトによって強制要求が処理されていることを示します。

● HV_LAST_DET_REPORT

設定値 : Online、Offline、Faulted、NoReportのいずれか

ディテクタから通知された 新のオブジェクトの状態です。

● HV_OFFLINE_REASON

設定値 : DEACT、SWITCH、FAULT、STOP、SHUTのいずれか

リソースが Offline状態になる理由が設定されます。SWITCH:userApplicationの切替え要求 (hvswitch)で OfflineになったSTOP:userApplicationの停止要求 (hvutil -f、hvutil -c)で OfflineになったFAULT:リソース故障で OfflineになったDEACT:userApplicationの非活性要求 (hvutil -d)で OfflineになったSHUT:RMSの停止要求 (hvshut)で Offlineになった

● HV_NODENAME

設定値 : 任意のオブジェクト名

現在のオブジェクトを示すグラフノードの名前です。

● HV_REQUESTING_CONTROLLER

設定値 : コントローラ名およびノード名

空でない場合、現在のスクリプトの実行を要求したコントローラおよびノードの名前が格納されます。

● HV_SCALABLE_CONTROLLER

設定値 : スケーラブルコントローラ名

このアプリケーションを制御するスケーラブルコントローラの名前です。

● HV_SCALABLE_INFO

設定値 : スケーラブルアプリケーションのリスト

クラスタ内にあるすべてのスケーラブルアプリケーションのリストが格納されます。

● HV_SCRIPT_TYPE

設定値 : PreCheckScript、PreOnlineScript、OnlineScript、PostOnlineScript、PreOfflineScript、OfflineScript、PostOfflineScript、OfflineDoneScript、FaultScriptスクリプトタイプのいずれか

スクリプトの種類です。

● NODE_SCRIPTS_TIME_OUT

設定値 : 0 - MAXINT

現在のオブジェクトまたは、オブジェクトに対応する各スクリプトのタイムアウト値です。

J2UZ-5294-06Z0(03) 231

Page 240: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

RMS スクリプト実行環境変数 付録 — 環境変数

HV_REQUESTING_CONTROLLER、HV_SCALABLE_CONTROLLER、HV_SCALABLE_INFOはコントローラオブジェクトにより制御されるアプリケーションの Online/Offline 処理でのみで使用できます。

232 J2UZ-5294-06Z0(03)

Page 241: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

15 付録 — RMS コマンドラインインタフェース

RMS 構成設定の中心的なインタフェースは RMS Wizard Tools であり、RMS 管理の中心的なインタフェースは Cluster Admin GUI です。RMS Wizard Tools と Cluster Admin GUI のユーザインタフェースは、内部で RMS CLI を呼び出しています。条件によっては CLI を直接起動するほうが便利なこともあります。

次のセクションでは、管理者が使用可能な RMS CLI コマンドの一覧を示します。これらのコマンドの使用法については、"RMS 導入運用手引書 " の "RMS の操作 " でいくつか説明されています。各コマンドの詳細な使用方法については、オンラインマニュアルを参照してください。RMS に関連するすべてのPRIMECLUSTERコマンドについては、235ページの"16 付録 — マニュアルページ" を参照してください。

通常、RMS CLI コマンドの実行にはルート権限が必要です。ルート権限が不要な場合を以下の表に示します。

RMS CLI コマンドでは、アプリケーション名の大文字小文字は区別されません。

15.1 使用可能な RMS CLI コマンド

hvassert

hvassert コマンドは特定のオブジェクト状態の RMS オブジェクトをテストします。このコマンドをスクリプトに使用して、次のコマンドを発行する前に一定の状態を設定することができます。ルート権限は必要ありません。

hvattr

hvattrコマンドは、実行時の AutoSwitchOver属性を変更するためのインタフェースを提供します。1 つのノード上で変更を行えば、現在実行中の RMS 構成で、クラスタ全体の userApplicationオブジェクトに適用されます。指定できる値は、No、HostFailure、ResourceFailure、ShutDownです。詳細については、215 ページの "13 付録 — 属性 " の "AutoSwitchOver" を参照してください。

hvcmhvcm コマンドは、すべての監視オブジェクトに対するディテクタとベースモニタを起動します。ほとんどの場合、hvcm コマンドのオプションを指定する必要はありません。ベースモニタは RMS モジュールの意思決定の役割を果たします。ベースモニタはすべての RMS オブジェクトの設定およびアクセスを制御します。オブジェクトが失敗すると、ベースモニタは失敗を分析し、構成定義ファイルに指定されているオブジェクト仕様に従って適切な措置をとります。

hvconfig

hvconfig コマンドには、現在の RMS 構成定義情報を表示する、または現在の RMS 構成定義情報を出力ファイルに出力する、という 2 つの機能があります。hvconfigコマンドの出力内容は使用中の RMS 構成定義ファイルの内容と基本的に同じですが、元のファイルに記述されているコメントは出力されません。また、リソース一覧の出力順序は構成定義ファイルと異なる場合があります。

hvdisp

hvdispコマンドを実行すると、RMS オブジェクトの現在の RMS 構成情報が表示されます。ルート権限は必要ありません。

hvdump

hvdumpコマンドは、ローカルノードの RMS の調査情報を取得する場合に使用します。

hvlogclean

hvlogclean コマンドを実行すると、古いログファイルがサブディレクトリに保存されます。ログファイルの名前は RMS を 後に起動した時刻です (-dオプションを指定すると、古いログファイルが削除されます )。hvlogcleanを実行すると、RMS が稼動中であっても新しいログファイルが作成されます。

J2UZ-5294-06Z0(03) 233

Page 242: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

使用可能な RMS CLI コマンド 付録 — RMS コマンドラインインタフェース

hvsetenv

ローカルノード上で以下の RMS 環境変数を変更するインタフェースを提供します。

– HV_RCSTART RMS の自動起動を制御する

– HV_AUTOSTARTUP すべてのアプリケーションの自動起動を制御する

HV_RCSTARTと HV_AUTOSTARTUPの詳細については、223 ページの "14 付録 — 環境変数 " を参照してください。

hvshut

hvshut コマンドは、1 つ以上のノード上で RMS を停止します。ローカルノード上のベースモニタは、どのノードが停止されるかを伝えるメッセージを他の Onlineノードに送信します。

hvswitch

hvswitchコマンドは、クラスタアプリケーションの制御を RMS 構成内のシステムノード (SysNode)間で手動で切替えます。切替えるリソースのタイプは userApplication、システムノードのタイプは SysNode である必要があります。

hvutil

hvutilコマンドは、RMS に対する汎用のインタフェースです。以下の管理操作を実行します。

– ログレベルの動的設定

– userApplicationの Offline

– 障害が発生したリソースのクリア

– Wait状態にあるクラスタノードの停止

– ディテクタの監視間隔設定

– 保守モードの設定、その他

hvutil で高いログレベルを設定し、長期間ログを有効にしておくと、ディスク容量が足りなくなる場合があります。詳細については、オンラインマニュアルを参照してください。

234 J2UZ-5294-06Z0(03)

Page 243: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

16 付録 — マニュアルページ

本章では、CCBR、CF、CFS、CIP、PAS、クラスタリソース管理機構、RMS、RMS Wizards、SCON、シャットダウン機構 (SF)、非同期監視 (MA)、Web-Based Admin View、RMS ウィザード、およびその他のユーティリティに関するオンラインマニュアルページの一覧を示します。 マニュアルページを表示するには、以下のコマンドを入力します。

$ man man_page_name

このリストはコマンドやユーティリティを網羅したものではありません。 PRIMECLUSTER ユーティリティには、内部使用のみを目的としたものもあり、これらのマニュアルページはここに記載されていません。

マニュアルページのハードコピーを印刷するには、以下のコマンドを入力します。

% man man_page_name | col -b | lpr

16.1 CCBR

システム管理者

cfbackup PRIMECLUSTER ノードに関するクラスタ構成情報を保存する

cfrestore PRIMECLUSTER ノードで保存されたクラスタ構成情報を復元する

16.2 CF

システム管理者

cfconfig PRIMECLUSTER クラスタのノードを構成または構成を削除する

cfset /etc/default/cluster.configエントリを CF モジュールに適用もしくは変更する

cfreconノードにより使用されるクラスタインタコネクトを動的に再構成する

cftool ノードまたはクラスタのノード通信状態を出力する

rcqconfig クラスタ整合状態 ( クォーラム ) を設定または開始する

rcqquery クラスタの整合状態 ( クォーラム ) の状態を取得する

J2UZ-5294-06Z0(03) 235

Page 244: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

CIP 付録 — マニュアルページ

16.3 CIP

システム管理者

cipconfig CIP 2.0 を起動または停止する

ciptool クラスタ内のローカルノードとリモートノードに関する CIP 情報を取り出す

ファイルフォーマット

cip.cf CIP 構成定義ファイルフォーマット

16.4 PAS

システム管理者

mipcstat MIPC 統計

clmstat CLM 統計

16.5 クラスタリソース管理機構

システム管理者

clautoconfig 自動リソース登録を行う

clbackuprdb リソースデータベースを保存する

clexec クラスタノード間でコマンドを実行する

cldeldevice 自動リソース登録によって登録されたリソースを削除する

clinitreset リソースデータベースをリセットする

clinitscript 共用ディスク装置の接続確認結果を通知する

clrestorerdb リソースデータベースを復元する

clsetacfparam 共用ディスク装置の接続確認、および自動リソース登録の動作設定を行う

clsetparam リソースデータベースの動作環境を表示および変更する

clsetup リソースデータベースを設定する

clspconfig パトロール診断の動作設定を行う

236 J2UZ-5294-06Z0(03)

Page 245: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — マニュアルページ RMS

clsptl パトロール診断を実行する

clstartrsc リソースを活性化する (GDS のみ )

clstoprsc リソースを非活性にする (GDS のみ )

clsyncfile クラスタノード間でファイル配布を行う

ユーザコマンド

また、Web-Based System Administration ツール WSA に clgettreeコマンドもあります。

clgettree リソースデータベースのツリー情報を出力する

16.6 RMS

システム管理者

hvassert RMS のリソース状態をアサート ( テスト ) する

hvattr 1 つのノードから全クラスタの実行時の属性を変更する (RMS Wizard Tools をインストールしている場合 )

hvcm RMS 構成モニタを起動する

hvconfig RMS 構成定義ファイルを表示または保存する

hvdisp RMS のリソース情報を表示する

hvdump RMS に関するデバッグ情報を収集する

hvlogclean RMS ログファイルを削除する

hvlogcontrol ログディスクの容量を制御する

hvsetenvRMS の自動起動またはローカルノード上のユーザアプリケーションを制御する

hvshut RMS を停止する

hvswitch RMS ユーザアプリケーションリソースの制御を他のノードに切替える

hvutil RMS リソースの可用性を操作する

J2UZ-5294-06Z0(03) 237

Page 246: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

シャットダウン機構 (SF) 付録 — マニュアルページ

ファイルフォーマット

config.usRMS 構成定義ファイル

hvenv.local RMS ローカル環境変数ファイル

hvgdstartup RMS 汎用ディテクタ起動ファイル

16.7 シャットダウン機構 (SF)

システム管理者

rcsd シャットダウン機構 (SF) のシャットダウンデーモン

sdtool シャットダウンデーモンとのインタフェースを提供するツール

sfcipher パスワードを暗号化するツール

ファイルフォーマット

rcsd.cfg シャットダウンデーモンの構成定義ファイル

SA_blade.cfgBlade シャットダウンエージェントの構成定義ファイル

SA_wtinps.cfgWTI NPS シャットダウンエージェントの構成定義ファイル

SA_sunF.cfgsunF システムコントローラシャットダウンエージェントの構成定義ファイル

SA_sspint.cfgSun E10000 シャットダウンエージェントの構成定義ファイル

SA_scon.cfgSCON シャットダウンエージェントの構成定義ファイル

SA_ipmi.cfgIPMI (Intelligent Platform Management Interface) 互換プラットフォーム上の BMC (Board Management Controller) シャットダウンエージェント

SA_pprci.cfgRCI シャットダウンエージェントの構成定義ファイル

SA_SATxscf.cfgSolaris ミッドレンジ サーバ XSCF ボードシャットダウンエージェントの構成定義ファイル

SA_SATxscf2.cfgSolaris APL サーバ XSCF ボードシャットダウンエージェントの構成定義ファイル

SA_rccu.cfgRCCU シャットダウンエージェントの構成定義ファイル

SA_icmp.cfgICMP シャットダウンエージェントの構成定義ファイル

238 J2UZ-5294-06Z0(03)

Page 247: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — マニュアルページ 非同期監視 (MA)

SA_vmSPgp.cfgVM 用クラスタ連携ツール (vmSP) のシャットダウンエージェント (panic 用 ) の構成定義ファイル

SA_vmSPgr.cfgVM 用クラスタ連携ツール (vmSP) のシャットダウンエージェント (reset 用 ) の構成定義ファイル

SA_vmchkhost.cfgvmchkhost ( 管理 OS クラスタ連携 ) のシャットダウンエージェントの構成定義ファイル

上記シャットダウンエージェントについて、システム管理用のマニュアルページを参照するには、サフィックス‘.cfg’ を除いてください。

16.8 非同期監視 (MA)

cldevparam非同期監視のチューニング可能な動作環境の変更/表示

clmmbmonctl MMB 非同期監視デーモンの動作状態の表示/起動/停止/再起動

clmmbsetup MMB 情報の登録/変更/削除/表示

clrcimonctl RCI 非同期監視のデーモンの動作状態表示/起動/停止/再起動

clrccumonctlコンソール非同期監視のデーモンの動作状態表示/起動/停止/再起動

clrccusetupコンソール情報の登録/変更/削除/表示

16.9 Web-Based Admin View

システム管理者

fjsvwvbs Web-Based Admin View を停止する

fjsvwvcnf Web-Based Admin View の Web サーバを起動、停止、および再起動する

wvCntl Web-Based Admin View のデバッグ情報を起動、停止、および取得する

wvGetparam Web-Based Admin View の RMS 環境変数を表示する

wvSetparam Web-Based Admin View の RMS 環境変数を設定する

wvstat Web-Based Admin View の操作状態を表示する

J2UZ-5294-06Z0(03) 239

Page 248: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

RMS ウィザード 付録 — マニュアルページ

16.10 RMS ウィザード

RMS Wizard Tools と RMS Wizard KitRMS ウィザードのマニュアルは、CD-ROM の SMAWRhv-doパッケージに HTML 文書として保存されています。このパッケージをインストールすると、マニュアルが以下のディレクトリに保存されます。

<RELIANT_PATH>/htdocs.solaris/wizards.en (Solaris)

<RELIANT_PATH>/htdocs.linux/wizards.en (Linux)

<RELIANT_PATH> のデフォルト値は /opt/SMAW/SMAWRrms/です。

システム管理者

clrwzconfig RMS 構成定義を Activate 後、PRIMECLUSTER リソースマネージャとミドルウェア製品との連携機能を設定する

16.11 その他のユーティリティ

cluster_uninstall PRIMECLUSTER ソフトウェアのアンインストール ( マニュアルページは Solaris 版のみ )

sshconf2 つ以上のノード間の ssh アクセスを構成設定する。

240 J2UZ-5294-06Z0(03)

Page 249: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

17 付録 — リリース情報

本章では、本マニュアルの主な変更箇所について説明します。

項番 VL 版数 変更箇所 内容

1 4.3A10 2011 年6 月版

126ページの "5.16 SYS: SysNodeオブジェクト "

(SYS, 8) のメッセージを修正しました。

2 4.3A10 2011 年6 月版

224 ページの "14.2 RMS グローバル環境変数 "

以下のグローバル環境変数の説明を変更しました。・HV_LOG_ACTION_THRESHOLD・HV_LOH_INTERVAL

3 4.3A10 2011 年6 月版

238 ページの "16.7 シャットダウン機構 (SF)"

ファイルフォーマットを変更しました。

4 4.3A10 2012 年2 月版

4 ページの "1.5 略称 " サポート OS から Solaris9 を削除し、Solaris11 を追加しました。

5 4.3A10 2012 年2 月版

23 ページの "2.5.6 Fault クリア " 強制 Online 要求の手順を削除しました。

6 4.3A10 2012 年2 月版

125 ページの "5.15 SWT: 切替要求(hvswitch コマンド )"

(SWT, 4) のメッセージの説明を変更しました。

7 4.3A10 2012 年2 月版

193ページの "8.9 SWT:切替え要求(hvswitch コマンド )"

以下のメッセージの本文および説明を変更しました。 - (SWT, 13)- (SWT, 30)- (SWT, 31) - (SWT, 32)- (SWT, 33)

8 4.3A10 2012 年2 月版

224 ページの "14.2 RMS グローバル環境変数 "

RELIANT_SHUT_MIN_WAIT の記事を修正しました。

9 4.3A10 2012 年2 月版

228 ページの "14.3 RMS ローカル環境変数 "

HV_CONNECT_TIMEOUT の設定値とデフォルトを変更しました。

10 4.3A10 2012 年2 月版

238 ページの "16.7 シャットダウン機構 (SF)"

SA_pprci.cfgの説明からPRIMEPOWERの記載を削除しました。

11 4.3A10 2012 年2 月版

238 ページの "16.7 シャットダウン機構 (SF)"

SA_snmp.cfg を削除しました。

12 4.3A10 2012 年2 月版

243 ページの " 用語集 " GFS ローカルファイルシステムを削除しました。

13 4.3A10 2012 年2 月版

243 ページの " 用語集 " の「切替方式」

RIP 方式を削除しました。

14 4.3A10 2012 年2 月版

243 ページの " 用語集 "- モデル混在クラスタ- 自動電源制御- 電源連動 ( 制御 )

SPARC Enterprise M シリーズ対応用に説明を変更しました。

15 4.3A20 2012 年12 月版

145 ページの "6.3 BM: ベースモニタ "

(BM, 122) のメッセージを追加しました。

16 4.3A20 2012 年12 月版

155 ページの "6.15 WRP: ラッパ " 以下のメッセージを追加しました。- (WRP, 69)- (WRP, 70)- (WRP, 71)

J2UZ-5294-06Z0(03) 241

Page 250: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

付録 — リリース情報

17 4.3A20 2012 年12 月版

159 ページの "7.1 コンソールメッセージ "

以下のメッセージを削除しました。- hvsend: dest_object is not specified.- Modification file name is missing on thecommand line, usage: hvmod [-i] [-l] -fconfig_file.us | -E | -L | [-i] [-l] -c"modification directives"- Too many arguments, usage: hvmod -E- Usage: hveject -s host- Usage: hvjoin -s host- Usage: hvmod [-i] [-l] -f config_file.us | -E |-L | [-i] [-l] -c "modification directives"- Usage: hvrcp localfile node:remotefile- Usage: hvsend { [ -m message ] [ -s system ][ -w waittime ] dest_object | -f in_file [dest_object ] }

18 4.3A20 2012 年12 月版

全体 SIS の説明を削除しました。

19 4.3A20 2013 年2 月版

73 ページの "4.11 RMS トラブルシューティング "

「RMS が他ノードの障害を検出しても、そのノードが強制停止されない。」場合の説明を変更しました。

項番 VL 版数 変更箇所 内容

242 J2UZ-5294-06Z0(03)

Page 251: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

用語集

ACアクセスクライアントを参照。

APIアプリケーションプログラムインタフェースを参照。

BM ( ベースモニタ ) (RMS)RMS の中心となるリソースの可用性を管理するモジュールプロセス。BM ( ベースモニタ ) はデーモンとディテクタから構成され、RMS が管理するオブジェクトの状態変更の調整 / 制御を行う。監視中の RMS オブジェクトに異常が発生した場合には、構成定義に従ってリカバリ処理 ( ローカルリカバリまたはリモートリカバリ ) を実行する。

Cache FusionOracle 9i で改良されたプロセス間通信インタフェース。論理ディスクブロック ( バッファ ) を更新する際、各ノードのローカルメモリ上にキャッシュされているブロックをディスクにフラッシュするかわりに、インタコネクト経由で、ブロックを他のノードにコピーすることで、物理 I/O のオーバーヘッドをなくし、処理を高速化することができる。

CCBRクラスタ構成のバックアップおよびリストアを参照。

ccbr.conf /opt/SMAW/ccbr ディレクトリに配置されるバックアップ / リストア用の環境設定ファイル。 $CCBRHOME 変数の設定などに使用する。 詳細は、cfbackup(1M) コマンドおよび cfrestore(1M)コマンドのマニュアルページおよび ccbr.conf ファイル内のコメントを参照。

ccbr.gen /opt/SMAW/ccbr ディレクトリに配置される世代数を格納するためのファイル。 0 以上の値が格納される。 詳細は、cfbackup(1M) コマンドおよび cfrestore(1M) コマンドのマニュアルページを参照。

CCBRHOME 変数 バックアップデータが格納されるディレクトリを示す。初期値は /var/spool/pcl4.1/ccbr ディレクトリになる。 この変数は、ccbr.conf ファイルでのみ設定可能。

CFCluster Foundation を参照。

Cluster Foundation基本的なクラスタリング通信サービスを提供する PRIMECLUSTER モジュールの集まり。

関連項目 クラスタ基盤 (CF)

DHCP Dynamic Host Control Protocol。起動時にノードに対して情報を送信するための標準的な方法。典型的な用途は、ノードの IP アドレスおよびネットマスクの動的割当てであるが、ドメイン名、DNS サーバ、およびタイムサーバなどのパラメタ割当てもできる。

DOWN (CF)ノードが使用不可であることを示すノード状態 (DOWN状態と呼ぶ )。LEFTCLUSTER状態のノードをクラスタに再参入させるためには、事前にそのノードの状態を DOWNに変更する必要がある。

関連項目 UP (CF)、LEFTCLUSTER (CF)、ノード状態 (CF)

Enhanced Lock Manager (ELM) (CF)軽量、高性能、高速応答のロックマネージャ。

J2UZ-5294-06Z0(03) 243

Page 252: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

用語集

ENS (CF)イベント通知サービス (CF) を参照。

GDSGlobal Disk Services を参照。

GFSGlobal File Services を参照。

GFS 共用ファイルシステム GFS 共用ファイルシステムは、共用ディスク装置を接続した複数の Solaris から一貫性 / 整合性を保った同時アクセスが可能であり、一部のノードがダウンしても、他のノードは処理を継続できることを特長とする共用ファイルシステムです。 GFS 共用ファイルシステムは、複数のノードから同時にマウントして使用できます。

Global Disk Servicesディスク装置に格納されたデータの可用性と運用管理性を向上させるためのボリューム管理機能を提供するサービス。

Global File Servicesクラスタ内の 2 つ以上のノードから共有記憶ユニットのファイルシステムの直接、同時アクセス機能を提供するサービス。

Global Link Servicesネットワーク伝送路を冗長化することにより、ネットワークの高可用性を実現するサービス。

GLSGlobal Link Services を参照。

GUIグラフィカルユーザインタフェースを参照。

IPMI (Intelligent Platform Management Interface)コンピュータの監視や管理を行うための共通インタフェースのファームウェアおよびハードウェア仕様。IPMI は、対象マシンにオンボードで搭載された Baseboard Management Controller(BMC) を通じて動作。OS とは別に動作するため、対象マシンの電源が入っていない場合にも遠隔管理ができる。

IP アドレスインターネットプロトコルアドレスを参照。

IP エイリアス1 つの物理ネットワークインタフェースに複数の IP アドレス ( エイリアス ) を割り当てる機能。IPエイリアスにより、他のノードでアプリケーションを実行する場合にも同じ IP アドレスで通信を続けることができる。

関連項目 インターネットプロトコルアドレス

JOIN (CF)クラスタ参入サービス (CF) を参照。

LAN業務 LAN を参照。

LEFTCLUSTER (CF)ノードが同じクラスタにある他のノードと通信できないことを示すノード状態。ノードがクラスタを離れていることになる。LEFTCLUSTERという中間状態は、ネットワークパーティションの問題を防ぐために設けられている。

関連項目 UP (CF)、DHCP、ネットワークパーティション (CF)、ノード状態 (CF)

244 J2UZ-5294-06Z0(03)

Page 253: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

用語集

MAC アドレスMAC address。ローカルエリアネットワーク (LAN) の MAC 副層で用いられる局、あるいはノードを示すアドレス。

MDSメタデータサーバを参照。

MIB(Management Information Base)ローカルネットワークデバイスの情報を格納した階層データベース。このデータベースは、SNMPエージェントなどのネットワーク管理ソフトウェアで保守される。

MMBPRIMEQUEST に搭載されるハードウェアの 1 つである Management Board の略称。

NIC 切替方式GLS が提供する LAN 二重化方式の 1 つ。二重化した NIC を排他使用し、Solaris サーバとスイッチング HUB 間の LAN 監視と異常検出時の切替えを実現する。

OPSOracle パラレルサーバを参照。

Oracle パラレルサーバOracle パラレルサーバは、クラスタ化されたプラットフォームまたは MPP (massively parallel processing) プラットフォームのユーザおよびアプリケーションにデータベースのすべてのデータへのアクセス機能を提供する。

OSD (CF)オペレーティングシステム依存 (CF) を参照。

PRIMECLUSTER サービス (CF)クラスタ化アプリケーションにサービス、および内部インタフェースを提供するサービスモジュール。

RCCUリモートコンソール接続装置 (Remote Console Connection Unit) の略称。

関連項目 リモートコンソール接続装置

Reliant Monitor Services (RMS)監視、および切替機能によりユーザが指定したリソースの高可用性を維持するサービス。

RMSReliant Monitor Services (RMS) を参照。

RMS Wizard KitRMS Wizard Kit の各コンポーネントは、特定のアプリケーション (Oracle, R/3) の RMS ウィザードツールに新しいメニュー項目を追加する。

関連項目 RMS Wizard Tools、Reliant Monitor Services (RMS)、RMS ウィザード

RMS Wizard ToolsRMS 構成のアプリケーションの作成および管理に使用する各種設定、および管理ツールで構成されるソフトウェアパッケージ。RMS ウィザードの基盤および、BM ( ベースモニタ ) とのインタフェースを提供する。

関連項目 RMS Wizard Kit、RCCU

J2UZ-5294-06Z0(03) 245

Page 254: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

用語集

RMS ウィザードRMS が動作するための構成定義を作成するためのソフトウェアツール。RMS ウィザードは、RMS Wizard Tools と RMS Wizard Kit の 2 つによって構成されている。

関連項目 RMS Wizard Tools、RMS Wizard Kit

RMS 構成複数のノードを共用リソースに接続する構成。各ノードはオペレーティングシステム、RMS ソフトウェア、固有アプリケーションのコピーを固有に保持する。

RMS コマンドRMS リソースをコマンドラインから管理するコマンド。

SANSNMP(Simple Network Management Protocol) を参照。

Scalable Internet Services (SIS)Scalable Internet Services の TCP 接続は、各接続の通常のクライアント / サーバセッションを維持しながらクラスタノード間のネットワークアクセス負荷を動的に分散する。

SCONシングルコンソールを参照。

SDX オブジェクト (GDS) クラス、グループ、SDX ディスク、ボリュームなど、GDS が管理する資源の総称。

SDX ディスク (GDS) GDS が管理しているディスクの総称。SDX ディスクは、用途に応じてシングルディスク、キープディスク、スペアディスク、および未定義ディスクと呼ばれる場合があります。SDX ディスクを単に「ディスク」と呼ぶ場合もあります。

SISScalable Internet Services (SIS) を参照。

SNMP(Simple Network Management Protocol)管理対象ネットワークデバイス間で情報の通信を行うためのプロトコル。このプロトコルは、デバイスに常駐するソフトウェアエージェントによって実装される。それぞれのエージェントは、ネットワーク上の他のデバイスからの SNMP 要求に対応して、ローカルの MIB(Management Information Base) データを読み書きすることができる。

Storage Area Network複数の外部記憶装置どうしを接続し、複数のコンピュータに接続する高速ネットワーク。通常はファイバチャネルの接続。

UP (CF)ノードが同じクラスタにある他のノードと通信できることを示すノード状態。

関連項目 DHCP、LEFTCLUSTER (CF)、ノード状態 (CF)

Web-Based Admin ViewPRIMECLUSTER のグラフィックユーザインタフェースを活用するための共通基盤。インタフェースは Java で記述されている。

Wizard KitRMS Wizard Kit を参照。

246 J2UZ-5294-06Z0(03)

Page 255: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

用語集

XSCFeXtended System Control Facility の略。本体装置の CPU とは独立した専用プロセッサで構成されているシステム監視機構。冷却部 (FAN ユニット )、電源ユニット、システム状態監視、周辺装置の電源投入/切断、異常監視を一括して制御する。さらに、遠隔地からの本体装置の管理を可能にするためにシリアルポートまたはイーサネット接続経由で、本体装置をモニタする機能、故障情報をシステム管理者に通報する機能、コンソール入出力機能を兼ね備えている。

アクセスクライアント各ノード上の GFS カーネルモジュール。メタデータサーバと通信し、共用ファイルシステムへの同時アクセス機能を提供する。

関連項目 メタデータサーバ

アプリケーション (RMS)RMS において、アプリケーションオブジェクトとは、他のオブジェクトを論理集合にまとめるためのリソースのこと。通常は、実際のアプリケーションソフトウェアや、高可用性構成のアプリケーションスイートを表すために使用される。

アプリケーションテンプレート (RMS)定義済みのオブジェクト定義の値の集まり。RMS Wizard Kit で特定タイプのクラスタアプリケーションのオブジェクト定義を作成する際に使用される。

アプリケーションプログラムインタフェースアプリケーションが、OS などのサービスプロバイダが提供するサービスを利用する際に使うインタフェース。

イーサネットIEEE802.3 にて標準化された LAN 規格。現在、特殊な用途を除いて、ほとんどの LAN はイーサネットである。なお、イーサネットという表現は元々 10 メガバイト / 秒タイプの LAN 規格の名称であるが、現在は高速イーサネット / ギガバイトイーサネットをも含んだ総称としても用いられる。

イベント通知サービス (CF)クラスタ内で発生したイベントをノード間にブロードキャストする機能を提供する PRIMECLUSTERモジュール。

インストールサーバネットワークを通じてクライアントマシンにオペレーティングシステムをインストールできるための設定を施したサーバ。

インターネットプロトコルアドレスコンピュータまたはアプリケーションに割り当てられる数値アドレス。

関連項目 IP エイリアス

インタコネクト (CF)クラスタインタコネクト (CF) を参照。

ウォッチドックタイマ監視 OS ハングやブート異常を監視するタイマ値。

ウィザード (RMS)テスト済みのオブジェクト定義を使って特定タイプのアプリケーションを作成するインタラクティブなソフトウェアツール。

エラー検出 (RMS)エラーを検出するプロセス。RMS では、ログの記録開始、ログファイルへのメッセージ送信、リカバリ処理の実行などを行う。

J2UZ-5294-06Z0(03) 247

Page 256: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

用語集

応答待ち時間 ( レイテンシ )データの送信要求を行ってから、実際に応答を受信するまでの時間間隔。

オブジェクト (RMS)構成定義ファイルまたはシステムグラフでは、ノードは物理または仮想リソースを示す。

関連項目 リーフオブジェクト (RMS)、オブジェクト定義 (RMS)、ノード状態 (CF)、オブジェクトタイプ (RMS)

オブジェクトタイプ (RMS)ディスクドライブなど監視される同種のリソースをグループ化するカテゴリ。各オブジェクトタイプにはプロパティと呼ばれる固有の属性があり、この属性により実行する監視またはアクションの種類を限定または定義する。リソースを特定のオブジェクトタイプに関連付けると、関連付けたオブジェクトタイプの属性がリソースに適用される。

関連項目 汎用タイプ (RMS)

オブジェクト定義 (RMS)RMS の監視対象となるリソースを識別する構成定義ファイルのエントリ。定義された属性により、関連するリソースのプロパティが指定される。オブジェクト定義に関連するキーワードに objectがある。

関連項目 属性 (RMS)、オブジェクトタイプ (RMS)

オペレーティングシステム依存 (CF)オペレーティングシステム本体と、OS 非依存の PRIMECLUSTER モジュールとの間のインタフェースを提供するモジュール。

オペレーティングシステム本体オペレーティングシステムのうち、常にアクティブでシステムコールを実際の処理に変換している部分。

親 (RMS)1 つ以上の子オブジェクトを保持する、構成定義ファイルまたはシステムグラフのオブジェクト。

関連項目 子 (RMS)、構成定義ファイル (RMS)、サブアプリケーション (RMS)

オンラインメンテナンスホストのシャットダウンや電源オフの必要なく機器を追加、削除、または交換できる機能。

回線切替装置 (Oracle Solaris 10 環境のみ )外部からの回線を複数ノードの間に接続して、RCI により接続ノードの切替えを行う装置。

下位グループ (GDS) 他のグループに属しているグループ。下位グループにはボリュームを作成できません。

拡張性作業負荷の増加に動的に対処するコンピューティングシステムの機能。拡張性は、特にインターネットベースのアプリケーションにおいて、インターネットの使用量の増大に伴って重要になる。

カスタムタイプ (RMS)汎用タイプ (RMS) を参照。

カスタムディテクタ (RMS) ディテクタ (RMS) を参照。

仮想インタフェース (VIP)クラスタの複数ノードをシングルシステムイメージとして見せるために、SIS が使用する仮想的なIP アドレスまたはノード名。

248 J2UZ-5294-06Z0(03)

Page 257: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

用語集

仮想ディスク仮想ディスクでは、Solaris 論理 I/O システムの 上位と物理デバイスドライバとの間に擬似デバイスドライバが追加される。擬似デバイスドライバはすべての論理 I/O 要求を物理ディスク上にマップする ( 富士通テクノロジー・ソリューションズ製品から移行のお客様のみ )。

関連項目 連結仮想ディスク、ミラー仮想ディスク (VM)、単独仮想ディスク、ストライプ化仮想ディスク

可用性多くの企業が必要とする、インターネットによる 24 時間年中無休のアプリケーション稼動環境の達成度を示す指標。実際と計画の使用時間の比較によってシステムの可用性が決まる。

環境変数 (RMS)グローバルに定義された変数またはパラメタ。

管理 LANPRIMECLUSTER の構成における、システムコンソールやクラスタコンソールなどが接続されたプライベートローカルエリアネットワーク (LAN)。管理 LAN には、一般ユーザがアクセスできないため、非常に高いレベルのセキュリティを確保できる。管理 LAN を使用するかどうかは選択可能。

関連項目 業務 LAN

キーワード ( 予約語 )プログラミング言語において、ある特別な意味を持つ用語。たとえば、構成定義ファイルの nodeキーワードは、後に続く定義の種類を指定する。

キューメッセージキューを参照。

業務 LAN一般ユーザがマシンにアクセスするためのローカルエリアネットワーク (LAN)。

関連項目 管理 LAN

共用ディスク接続確認ノード起動時に共用ディスク装置の電源投入漏れやケーブルの結線誤りがないことを確認する機能。

共用リソース複数ノード間で共有されるディスクドライブなどのリソース。

関連項目 専用リソース (RMS)、リソース (RMS)

切替え (RMS)userApplicationの制御を監視対象の 1 つのノードから他のノードに切替える RMS のプロセス。

関連項目 自動切替え (RMS)、指定切替え (RMS)、フェイルオーバ (RMS、SIS)、対称切替え (RMS)

切替方式GLS が提供する LAN 二重化の方式名。高速切替方式、NIC 切替方式、GS/SURE 連携方式、マルチパス方式、マルチリンクイーサネット方式、の合計 5 種類が存在する。

クラス (GDS) ディスククラス (GDS) を参照。

クラスタ1 つのコンピューティングソースに統合されるコンピュータの集まり。クラスタは分散型のパラレルコンピューティングを実行する。

関連項目 RMS 構成

J2UZ-5294-06Z0(03) 249

Page 258: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

用語集

クラスタアプリケーション (RMS)RMS のリソース定義において、userApplicationに分類されるリソース。複数のリソースをアプリケーション単位にグループ化する際に使用される。

クラスタインタコネクト (CF)PRIMECLUSTER がノード間の通信処理で専用に使用するネットワーク接続。

クラスタ基盤 (CF)基本 OS の上位で動作する PRIMECLUSTER の基本モジュール。PRIMECLUSTER の上位サービスが使用する機能を CF(Cluster Foundation) インタフェースとして提供する。

関連項目 Cluster Foundation

クラスタ構成のバックアップおよびリストアCCBR を使用すると、あるクラスタノードについて現在の PRIMECLUSTER 構成情報を簡単に保存することができる。また、構成情報をリストアすることもできる。

クラスタ参入サービス (CF)新規クラスタの作成およびクラスタへのノードの追加を処理する PRIMECLUSTER サービス。

クラスタ整合状態 ( クォーラム )クラスタシステムを構成するノード間の整合性が保たれている状態。具体的には、クラスタシステムを構成する、各ノードの CF の状態が UPまたは DOWNである状態 (LEFTCLUSTERとなっているノードが存在しない )。

クラスタリソース管理機構複数のノード間で共用されるハードウェアを管理する機構。

グラフ (RMS)サブアプリケーション (RMS) を参照。

グラフィカルユーザインタフェースウィンドウ、アイコン、ツールバー、プルダウンメニューを使った、コマンドラインインタフェースより使いやすいコンピュータインタフェース。

グループ (GDS) ディスクグループ (GDS) を参照。

経路"PRIMECLUSTER コンセプトガイド " では、ノードとノードの間を接続する冗長化されたクラスタインタコネクトの各々のネットワーク経路を意味している。

ゲートウェイクラスタノード (SIS)ゲートウェイクラスタノードは外部ネットワークインタフェースを有し、すべての受信パッケージはこのノードで受信され、サービスのスケジューリングアルゴリズムに従って選択したサービスノードに転送される。

関連項目 サービス提供ノード (SIS)、データベースノード (SIS)、Scalable Internet Services (SIS)

子 (RMS)1 つ以上の親に属し、構成定義ファイルに定義されるリソース。子は複数の親に属することが可能。また、子を保持して親ノードとなることも、子を持たずにリーフオブジェクトとなることも可能。

関連項目 リソース (RMS)、オブジェクト (RMS)、親 (RMS)、リーフオブジェクト (RMS)

高可用性冗長リソースにより一点故障箇所を排除する概念。

250 J2UZ-5294-06Z0(03)

Page 259: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

用語集

構成定義ファイル (RMS)監視するリソースを定義し、リソース間の相互依存性を設定する RMS 構成定義ファイル。デフォルトファイル名は config.us。

高速切替方式GLS が提供する LAN 二重化方式の 1 つ。多重化した LAN を同時に使用し、Solaris サーバ間通信のスケーラビリティ向上と、LAN 異常発生時の高速な切替えを実現する。

コンカチネーション複数の物理ディスクを連結すること。複数のディスクを仮想的に 1 つの大容量ディスクとして使用する仕組み。

コンソールシングルコンソールを参照。

上位グループ (GDS)他のグループに属していないグループ。 上位グループには、ボリュームを作成できます。

サービス提供ノード (SIS)FTP、Telnet、HTTP など 1 つ以上の TCP サービスを提供し、ゲートウェイクラスタノードからクライアント要求を受信する。

関連項目 データベースノード (SIS)、ゲートウェイクラスタノード (SIS)、Scalable Internet Services (SIS)

サブアプリケーション (RMS)高可用性の 1つのリソースタイプを構成するために設計された構成用テンプレートの一部。RMS 構成には各リソースタイプの複数のインスタンスが含まれる場合がある。汎用テンプレートは、コマンド、アプリケーションコントローラ、IP アドレス、仮想ネットワークインタフェース、ローカルおよびリモートのファイルシステム、ボリュームマネージャ、およびストレージマネージャ用のサブアプリケーションを含む。

システムグラフ (RMS)構成定義ファイルの作成、または解釈に使用される監視対象リソースのビジュアル表示 ( マップ )。

関連項目 構成定義ファイル (RMS)

システムディスク (GDS) 動作中のオペレーティングシステムがインストールされているディスク。次のいずれかのファイルシステム ( またはスワップ域 ) として現在動作しているスライスが存在するディスク全体を指します。

Solaris の場合 : /、 /usr 、 /var 、またはスワップ域Linux の場合 : /、 /usr 、 /var 、/boot、/boot/efi、またはスワップ域

指定切替え (RMS)管理者が RMS の userApplicationを指定したノードに切替える処理。

関連項目 自動切替え (RMS)、フェイルオーバ (RMS、SIS)、切替え (RMS)、対称切替え (RMS)

自動切替え (RMS)ある一定の条件が検出された際に、userApplicationの実行を他のノードへ自動的に切替えるRMS の処理。

関連項目 指定切替え (RMS)、フェイルオーバ (RMS、SIS)、切替え (RMS)、対称切替え (RMS)

自動電源制御自動電源制御は、ESF (Enhanced Support Facility) で提供している機能で、サーバの電源投入および、切断を自動的に行うための機能である。

J2UZ-5294-06Z0(03) 251

Page 260: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

用語集

シャットダウン機構異常が発生したノードを強制停止させるための機構。PRIMECLUSTER は、クラスタ整合性 ( クォーラム ) が保てない状態になったと判断した場合に、シャットダウン機構 (SF) を使用して、クラスタシステムをクラスタ整合状態 ( クォーラム ) に戻している。

状態リソース状態 (RMS) を参照。

状態遷移プロシジャクラスタ制御からの状態遷移指示を受け取り、リソースの活性 / 非活性化を制御 ( クラスタアプリケーションの起動 / 停止など ) するもの。

冗長化オブジェクトがクラスタ内の他のオブジェクトのリソース負荷を引継ぐ機能、および RAID ハードウェア、またはソフトウェアにより 2 次記憶装置に保存されているデータを複製する機能。

シングルコンソールRMS の監視対象ノードを集中管理するワークステーション。シングルコンソールソフトウェアのSCON はシングルコンソールから実行される。

シングルディスク (GDS) グループに属していない SDX ディスクで、シングルボリュームを作成できるディスク。

シングルボリューム (GDS) グループに属していないシングルディスク内に作成されたボリューム。データは冗長化されません。

スイッチオーバ ユーザの要求によりユーザ業務が運用系から待機系へ処理やデータを引継ぐこと。

スクリプト (RMS)リソースの状態遷移に対応して BM ( ベースモニタ ) から実行されるシェルプログラム。スクリプトによりリソースの状態が変更される場合もある。

スコープ (GDS) 共用タイプのディスククラスにおいてオブジェクトを共用できるノード群の範囲を表します。

ストライピングデータを一定のサイズに分割して、複数のスライスに交互に振り分けて書込むこと。I/O を複数の物理ディスクに分散して同時に発行する仕組み。

ストライプ化仮想ディスクストライプ化仮想ディスクは複数の区画で構成されます。物理パーティションや複数の仮想ディスク ( 通常はミラーディスク ) で構成することもできます。このようにして仮想ディスク上の連続したI/O 処理を複数の物理ディスク上の I/O 処理に変換することができる。この機能は RAID レベル 0 (RAID0) に該当する ( 富士通テクノロジー・ソリューションズ製品から移行のお客様のみ )。

関連項目 連結仮想ディスク、ミラー仮想ディスク (VM)、単独仮想ディスク、仮想ディスク

ストライプグループ (GDS) ストライプ (stripe) タイプのディスクグループ。ストライピングの単位となるディスクおよび下位グループの集まり。

ストライプ幅 (GDS) ストライピングする際の、データを分割するサイズ。

ストライプボリューム (GDS)ストライプグループ内に作成されたボリューム。ストライピングによって I/O 負荷を複数のディスクに分散させることができます。データは冗長化されません。

252 J2UZ-5294-06Z0(03)

Page 261: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

用語集

スペアディスク (GDS) 故障したディスクの替わりにミラーリング状態を回復させるための予備ディスク。

世代数 PRIMECLUSTER のバックアップ / リストアは、データの世代管理が可能で、現在の世代数は、バックアップおよびリストアデータの名前の一部として付加されます。なお世代数は 0 以上の整数が使用され、バックアップが成功するたびに 1 ずつ増加します。世代数は、ccbr.gen ファイル、または、cfbackup(1M) コマンドおよび cfrestore(1M) コマンドのオプション引数にて指定することができます。 詳細は、cfbackup(1M) コマンドおよび cfrestore(1M) コマンドのマニュアルページを参照してください。

専用ネットワークアドレスRFC1918 により指定された一定範囲の予約済 IP アドレス。どの部門でも使用可能であるが、異なる部門が同時に同じアドレスを使用する可能性があるため、インターネット経由で外部から参照できないようにする必要がある。

専用リソース (RMS)1 台のノードのみが使用可能で、他の RMS ノードからは使用できないリソース。

関連項目 リソース (RMS)、共用リソース

属性 (RMS)各オブジェクトタイプについて、BM ( ベースモニタ ) がどう処理するかを規定するオブジェクト。

対称切替え (RMS)すべての RMS ノードが他の任意の RMS ノードからリソースを引継ぐことのできる機能。

関連項目 自動切替え (RMS)、指定切替え (RMS)、フェイルオーバ (RMS、SIS)、切替え (RMS)

タイプオブジェクトタイプ (RMS) を参照。

多重ホスト複数のコントローラ経由で同一のディスク ( 富士通テクノロジー・ソリューションズ製品から移行のお客様のみ ) 。

単独仮想ディスク単独仮想ディスクは、物理ディスクパーティションの 1 領域、またはパーティション全体を定義します ( 富士通テクノロジー・ソリューションズ製品から移行のお客様のみ )。

関連項目 連結仮想ディスク、ストライプ化仮想ディスク、仮想ディスク

通知メッセージ (RMS)ディテクタが BM ( ベースモニタ ) に特定リソースの状態を通知するメッセージ。

停止要求クラスタ整合状態 ( クォーラム ) を回復するために、指定したノードを強制停止させるための指示。

ディスククラス (GDS)SDX オブジェクトの集まり。共用タイプのディスククラスは、PRIMECLUSTER システムで利用可能なリソースの単位でもあります。ディスククラスを単に「クラス」と呼ぶ場合もあります。

ディスクグループ (GDS)ミラーリング、ストライピング、またはコンカチネートされる単位となるディスクまたは下位グループの集まり。同じディスクグループに属しているディスクおよび下位グループは、そのディスクグループのタイプ属性 ( ミラー、ストライプ、またはコンカチネーション ) に応じて、互いに ミラーリング、ストライピング、またはコンカチネートされます。 ディスクグループを単に「グループ」と呼ぶ場合もあります。

J2UZ-5294-06Z0(03) 253

Page 262: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

用語集

ディテクタ (RMS)特定のオブジェクトタイプの状態を監視して、リソースの状態変化を BM ( ベースモニタ ) に通知するプロセス。

データベースノード (SIS)SIS 構成の設定、動的データ、統計を管理するノード。

関連項目 ゲートウェイクラスタノード (SIS)、サービス提供ノード (SIS)、Scalable Internet Services (SIS)

デーモン特定の機能を繰り返し実行する、システムに常駐するプロセス。

電源連動 ( 制御 )クラスタシステムにおいて、1 ノードの電源を投入すると、電源切断状態にあるその他すべてのノードおよびノードと RCI ケーブルで接続されたディスクアレイ装置の電源が投入されること。

テンプレートアプリケーション (RMS) を参照。

ネットワークアダプタLAN 関連のネットワークアダプタ。

ネットワークインタフェースカードネットワークアダプタを参照。

ネットワークパーティション (CF)クラスタ内の複数ノードのインタコネクトによる通信が不可能な場合に発生する状態。ネットワークパーティション状態でアプリケーションが共用ディスクにアクセスし続けるとデータの整合性がとれなくなる恐れがある。

ノードクラスタのメンバであるホスト。コンピュータノードとはコンピュータのことを指す。

ノード間通信機構PRIMECLUSTER CF で使用されるクラスタノード間の通信機能。クラスタノード間通信専用に設計されているため、TCP/IP よりもオーバヘッドが少なく、メッセージの到着順も保証したデータグラム通信サービスを行うことができる。

ノード状態 (CF)クラスタ内のすべてのノードは、同じクラスタの他のすべてのノードのローカル状態を管理する。クラスタ内のノードは、すべて UP、DOWN、または LEFTCLUSTERのいずれかの状態にある。

関連項目 UP (CF)、DHCP、LEFTCLUSTER (CF)

パトロール診断ハードウェアの故障を定期的に診断する機能。

ハブLAN や、ファイバチャネルで使用されるスター型の結線装置。

汎用タイプ (RMS)汎用プロパティを持つオブジェクトタイプ。汎用タイプは、既存のオブジェクトタイプに割り当てることのできない監視対象リソースがある場合に RMS をカスタマイズするために使用される。

関連項目 オブジェクトタイプ (RMS)

非同期監視SA の機能に加え、リモートクラスタノードの状態を監視し、そのノードのダウンを即時に検出するコンポーネント。

254 J2UZ-5294-06Z0(03)

Page 263: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

用語集

フェイルオーバ (RMS、SIS)SIS では、このプロセスにより障害発生ノードのバックアップノードへの切替えを行う。RMS では、このプロセスを切替えと呼ぶ。

関連項目 自動切替え (RMS)、指定切替え (RMS)、切替え (RMS)、対称切替え (RMS)

フォルトトレラントネットワーク ( 耐故障性を備えたネットワーク )耐故障性 ( フォルトトレラント ) を備えたネットワーク。耐故障性 ( フォルトトレラント ) とは、コンピュータシステムの一部に何らかの障害が発生した場合でも、正常な動作を保ち続ける能力のこと。よって、フォルトトレラントネットワークとはネットワークシステムの一部に異常が発生した場合でも、正常に通信を継続できるネットワークのことを意味している。

物理 IP アドレスネットワークインタフェースカードのインタフェース ( たとえば hme0) に直接割り振られた IP アドレス。関連する用語として論理 IP アドレスがある。論理インタフェースについては ifconfig(1M)の "logical interface" の説明を参照。

プライマリノード (RMS)RMS の起動時にユーザアプリケーションをオンラインにするデフォルトノード。userApplicationのオブジェクト定義中に 初に記述されたノードがプライマリノードとなる。

ボリューム (GDS) 論理ボリューム (GDS) を参照。

マウントポイントディレクトリツリー上でファイルシステムが接続されるポイント。

ミラー仮想ディスク (VM)ミラー仮想ディスクは複数の物理デバイスで構成され、すべての出力処理がすべてのデバイス上で同時実行される ( 富士通テクノロジー・ソリューションズ製品から移行のお客様のみ ) 。

関連項目 連結仮想ディスク、単独仮想ディスク、ストライプ化仮想ディスク、仮想ディスク

ミラーグループ (GDS)ミラー (mirror) タイプのディスクグループ。互いにミラーリングされるディスクおよび下位グループの集まり。

ミラーリング同じデータを複数のスライスに書込むことによって、冗長性を維持すること。一部のスライスで障害が発生したとしても、正常なスライスが残っていれば、ボリュームへのアクセスが継続できる仕組み。

メタデータサーバファイルシステム ( メタデータ ) の制御情報を一括管理する GFS デーモン。

メッセージ1 つのソフトウェアプロセスから他のプロセス、デバイス、またはファイルに伝送されるデータの集まり。

メッセージキューメッセージの保存場所として使用される専用のメモリ領域。

モデル混在クラスタ SPARC Enterprise の異なるモデルによって構築したクラスタシステム。たとえば 1 つのノードが SPARC Enterprise M3000 でもう 1 つのノードが SPARC Enterprise M4000 など。 モデルは、代表的なマシンでは SPARC T3-1/T3-2/T3-4、SPARC Enterprise T1000/T2000、SPARC Enterprise T5120/T5220/T5140/T5240/T5440、SPARC Enterprise M3000/M4000/M5000/M8000/M9000 で分かれます。

J2UZ-5294-06Z0(03) 255

Page 264: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

用語集

ユーザグループWeb-Based Admin View や Cluster Admin GUI が提供する環境設定、運用管理などの操作範囲を限定するもので、wvroot、clroot、cladmin、clmonの 4 種類がある。クラスタ管理サーバのオペレーションシステムの管理者に依頼して、個々のユーザ ID を適切なユーザグループへ登録する。

リーフオブジェクト (RMS)システムグラフの 下位オブジェクト。リーフオブジェクトは構成定義ファイルの 後に定義される。リーフオブジェクトはその配下に子オブジェクトを持たない。

リソース (RMS)ミラーディスク、ミラーディスク部品、データベースサーバなどの機能を提供する、専用または共用のハードウェアまたはソフトウェア要素。ローカルリソースは、ローカルノード上でのみ監視対象となる。

関連項目 専用リソース (RMS)、共用リソース

リソース状態 (RMS)リソースの現在の状態。

リソース定義 (RMS)オブジェクト定義 (RMS) を参照。

リソースデータベース複数のノード間で共用されるハードウェアの情報を管理するデータベース。リソースデータベースは、クラスタリソース管理機構により管理される。

リソースラベル (RMS)システムグラフに表示されるリソース名。

リモートコンソール接続装置RS232C インタフェースと LAN インタフェースを変換する装置。本装置により、LAN 接続された他の装置 ( パソコン ) から Telnet 機能により TTY コンソール機能を利用可能とする。

リモートノードリモートホストを参照。

リモートホスト遠距離通信回線または LAN を使ってアクセスするホスト。

関連項目 ローカルホスト

リンク (RMS)特定リソース間の親子関係を指定する。

連結仮想ディスク1 つ以上のディスクドライブ上の複数の区画で構成され、各部を合計したものに相当する。ディスクを細かく分割する単独仮想ディスクと異なり、各ディスクまたはパーティションを連結して 1 つの大規模な論理ディスクを構成する ( 富士通テクノロジー・ソリューションズ製品から移行のお客様のみ )。

関連項目 ミラー仮想ディスク (VM)、単独仮想ディスク、ストライプ化仮想ディスク、仮想ディスク

ローカル MAC アドレスローカルエリアネットワーク (LAN) のシステムごとに、システム管理者がそのシステム内部での一意性を保証する MAC アドレス。

ローカルエリアネットワーク業務 LAN を参照。

256 J2UZ-5294-06Z0(03)

Page 265: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

用語集

ローカルホストコマンドまたはプロセスを開始するホスト

関連項目 リモートホスト

ログファイル重要なシステムイベントやメッセージを記録したファイル。BM ( ベースモニタ )、ウィザード、ディテクタにはそれぞれ固有のログファイルがある。

ローリングアップデート クラスタシステムにおいて、修正適用、保守時に使用されるアップデート手法。1 ノードずつ順次修正適用を行うことで、業務を停止せずに修正を適用することが可能となる。

論理ボリューム (GDS) 利用者が直接アクセスできる仮想ディスクデバイスの総称。利用者は、物理ディスクのスライス( パーティション ) と同じように、論理ボリュームにアクセスできます。論理ボリュームを単に「ボリューム」と呼ぶ場合もあります。

J2UZ-5294-06Z0(03) 257

Page 266: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

用語集

258 J2UZ-5294-06Z0(03)

Page 267: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

略語

ACアクセスクライアント (Access Client)

APIアプリケーションプログラムインタフェース (application program interface)

BMベースモニタ (base monitor)

CFCluster Foundation または Cluster Framework

CIMクラスタ整合性モニタ (Cluster Integrity Monitor)

CIPクラスタインタコネクトプロトコル (Cluster Interconnect Protocol)

CLIコマンドラインインタフェース (command-line interface)

CLMCluster Manager

CRMクラスタリソース管理 (Cluster Resource Management)

DLPIData Link Provider Interface

EEEnterprise Edition

ELMEnhanced Lock Manager

ENSイベント通知サービス (Event Notification Services)

GDSGlobal Disk Services

GFSGlobal File Services

GLSGlobal Link Services

GUIグラフィカルユーザインタフェース (graphical user interface)

HA高可用性 (high availability)

ICF

J2UZ-5294-06Z0(03) 259

Page 268: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

略語

ノード間通信機構 (Internode Communication Facility)

I/Fインタフェース (Interface)

I/O入出力 (input/output)

JOINクラスタ参入サービスモジュール (cluster join services module)

LANローカルエリアネットワーク (local area network)

MA非同期監視 (Monitoring Agent)

MDSメタデータサーバ (Meta Data Server)

MIBManagement Information Base

MIPCMesh Interprocessor Communication

MMBManagement Board

NICネットワークインタフェースカード (network interface card)

NSMNode State Monitor

OPSOracle パラレルサーバ (Oracle Parallel Server)

OSDオペレーティングシステム依存 (operating system dependant)

PASParallel Application Services

PSパラレルサーバ (Parallel Server)

RAORMS-Add on

RCCUリモートコンソール接続装置 (Remote Console Connection Unit)

RCIRemote Cabinet Interface

RMSReliant Monitor Services

260 J2UZ-5294-06Z0(03)

Page 269: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

略語

SAシャットダウンエージェント (Shutdown Agent)

SANStorage Area Network

SC拡張性クラスタ (Scalability Cluster)

SCFシステム監視機構 (System Control Facility)

SCONシングルコンソールソフトウェア (single console software)

SDシャットダウンデーモン (Shutdown Daemon)

SFシャットダウン機構 (Shutdown Facility)

SISScalable Internet Services

VIP仮想インタフェース (Virtual Interface Provider)

WKWizard Kit

WTWizard Tools

XSCFeXtended System Control Facility

J2UZ-5294-06Z0(03) 261

Page 270: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

略語

262 J2UZ-5294-06Z0(03)

Page 271: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

図 1: 初期化の例におけるオブジェクト階層 ................................................................................................... 9

図 2: 初期化におけるシステムグラフの例 — RMS Wizard Tools の構成 .................................................. 10

図 3: 初期化における hvdisp 出力の例 — RMS Wizard Tools の構成 ......................................................... 10

図 4: 保守モード時の制限の例 ......................................................................................................................... 27

図 5: スケーラブルコントローラの属性 ......................................................................................................... 36

図 6: 保守モード時のコントローラの例 ......................................................................................................... 42

図 7: 子が保守モードの場合にスケーラブルな親アプリケーションを切替える ..................................... 43

図 8: 親が保守モードの場合にスケーラブルな子アプリケーションを切替える ..................................... 43

図 9: 子が保守モードの場合に親を Offline にするよう試行する ............................................................... 44

図 10: 親が保守モードの場合に子を Offline にするよう試行する ............................................................... 44

図 11: PCS ディテクタの詳細メニュー ............................................................................................................. 54

図 13: RMS Wizard Tools のディテクタ詳細メニュー ..................................................................................... 55

図 14: ポップアップメニューから RMS switchlog ファイルを表示 .............................................................. 59

図 15: [ ツール ] メニューから RMS switchlog を表示 .................................................................................... 59

図 16: ポップアップメニューからアプリケーションログを表示 ................................................................. 59

図 17: タブビューに表示された RMS switchlog ............................................................................................... 60

図 18: タブ画面の<デタッチ>ボタン拡大図 ................................................................................................. 60

図 19: 別ウィンドウに表示された RMS switchlog ........................................................................................... 60

図 20: 別ウィンドウの<アタッチ>ボタン拡大図 ......................................................................................... 61

図 21: 日付時刻による検索 ................................................................................................................................. 62

図 22: リソース名による検索 ............................................................................................................................. 63

図 23: S 重要度による検索 ................................................................................................................................. 64

図 24: キーワードによる検索 ............................................................................................................................. 65

図 25: ログビューア上のポップアップ検索ダイアログ ................................................................................. 66

図 26: PCS グラフのコンテキストメニューからスクリプトを手動実行する ............................................ 69

図 27: PCS GUI の [Manual Script Execution] 出力ウィンドウ ........................................................................ 69

図 28: PCS CUI の [Configuration Start] 画面 ..................................................................................................... 70

図 29: PCS CUI の [Advanced Menu] .................................................................................................................. 70

図 30: PCS CUI の [Manual Script Execution Tree] — オブジェクトの選択 ................................................... 71

図 31: PCS CUI の [Manual Script Execution Tree] — スクリプトの選択 ....................................................... 71

図 32: PCS CUI の [Manual Script Execution Tree] — スクリプトの実行結果の表示 ................................... 72

図 33: RMS Wizard Tools のメイン構成メニュー ............................................................................................. 72

J2UZ-5294-06Z0(03) 263

Page 272: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

図 34: RMS Wizard Tools [ManualExecution: Application selection] メニュー ................................................ 72

図 35: RMS Wizard Tools [ManualExecution: Resource selection] メニュー .................................................... 73

図 36: RMS Wizard Tools [ManualExecution: Script selection] メニュー .......................................................... 73

264 J2UZ-5294-06Z0(03)

Page 273: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

表 1: 子アプリケーションの状態とスケーラブルコントローラの状態の関係 .................................... 37

表 2: ログファイル ........................................................................................................................................ 49

表 3: BM ( ベースモニタ ) のログレベル ................................................................................................... 51

表 4: RMS の重要度レベルの説明 .............................................................................................................. 64

表 5: RMS オブジェクトのディテクタが通知する状態 .......................................................................... 211

表 6: RMS オブジェクトのその他の状態 .................................................................................................. 211

表 7: RMS オブジェクトの StateDetails 値 ................................................................................................. 212

J2UZ-5294-06Z0(03) 265

Page 274: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

266 J2UZ-5294-06Z0(03)

Page 275: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

索引

記号/var/opt/SMAWRrms/log/ 58

AAffiliation、属性 220AlternateIp、属性 215andOp

説明 213必須属性 213

applicationsviewing log files 58

AutoRecoverFault 処理 21

AutoRecoverCleanup、属性 215AutoRecover、属性 215AutoStartUp、属性 215AutoSwitchOver

Fault 処理 19

Bbmlog の説明 49BM ( ベースモニタ )

エラーコード 77, 143, 179, 205デバッグメッセージ 48メッセージ 49ログファイル 49

CCCBR コマンド

cfbackup 235cfrestore 235

CFLEFTCLUSTER 24

CF コマンドcfconfig 235cfrecon 235cfset 235cftool 235rcqconfig 235rcqquery 235

CIP コマンドcip.cf 236cipconfig 236ciptool 236

Class、属性 220clautoconfig 236clbackuprdb 236cldeldevice 236clexec 236clgettree 237clinitreset 236clinitscript 236clrestorerdb 236clrwzconfig 240clsetacfparam 236

clsetparam 236clsetup 236clspconfig 236clsptl 237clstartrsc 237clstoprsc 237clsyncfile 237Cluster Admin

viewing log files 58cluster_uninstall 240ClusterExclusive、属性 216Comment、属性 220ControlledSwitch、属性 216

DDeact 状態 211DetectorStartScript、属性 220

EENV

説明 213必須属性 213

ENVL説明 213必須属性 213

FFaulted 状態 211FaultScript 19FaultScript、属性 216Fault のクリア要求の送信 23fjsvwvbs 239fjsvwvcnf 239

GgResource

オブジェクトタイプ 213必須属性 213

HHalt、属性 216HostName、属性 220HTML 文書 240HV_APPLICATION 39, 230HV_APPLICATION_STATE_CHANGE_INFO 39HV_AUTORECOVER 39, 230HV_AUTOSTART_WAIT 変数

PartialCluster 属性 218HV_AUTOSTARTUP 228HV_AUTOSTARTUP_IGNORE 224HV_AUTOSTARTUP 変数 215HV_AUTOSTART_WAIT 224HV_CHECKSUM_INTERVAL 225HV_COM_PORT 225HV_CONNECT_TIMEOUT 228

J2UZ-5294-06Z0(03) 267

Page 276: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

索引

HV_FORCED_REQUEST 39, 231HV_HOST_STATE_CHANGE_INFO 39HV_LAST_DET_REPORT 39, 231HV_LOG_ACTION 228HV_LOG_ACTION_THRESHOLD 225HV_LOG_WARN_THRESHOLD 225, 226HV_MAX_HVDISP_FILE_SIZE 228HV_MAXPROC 229HV_MLOCKALL 229HV_NODENAME 40, 231HV_OFFLINE_REASON 39, 231HV_RCSTART 229HV_REALTIMEPRIORITY 229HV_REQUESTING_CONTROLLER 231HV_SCALABLE_CONTROLLER 231HV_SCALABLE_INFO 231HV_SCRIPT_TYPE 40, 231HV_SCRIPTS_DEBUG 229HV_SYSLOG_USE 229HV_USE_ELM 226hvdisp コマンド 223

非表示 221ファイルサイズ 228

hvshut コマンドタイムアウト値の指定 227

hvutil コマンド-c option 23

II_List、属性 216Inconsistent 状態 211

LLastDetectorReport、属性 220LEFTCLUSTER 24LieOffline、属性 217log files

viewing 58

MMaintenance 状態 211MaxControllers、属性 220MA コマンド

cldevparam 239clmmbmonctl 239clmmbsetup 239clrccumonctl 239clrccusetup 239clrcimonctl 239

MonitorOnly、属性 217

NNODE_SCRIPTS_TIME_OUT 40, 231NoDisplay、属性 221NullDetector、属性 221

OOfflineDoneScript、属性 221OfflineFault 状態 211OfflineScript、属性 217

Offline 状態 211Offline 要求 16OnlinePriority、属性 217OnlineScript、属性 217Online 状態 211orOp、オブジェクトタイプ 213

PPartialCluster 属性

HV_AUTOSTART_WAIT 224PartialCluster、属性 218PAS コマンド

clmstat 236mipcstat 236

PersistentFault、属性 218PostOfflineScript

属性 218PostOnlineScript、属性 218PreCheckScript、属性 221PreOfflineScript、属性 218PreOffline 処理 17PreOnlineScript、属性 218PreserveState

Fault 処理への影響 19, 20PreserveState、属性 218PriorityList、属性 218

RRAID 252rcsd 238rcsd.cfg 238RELIANT_HOSTNAME 230RELIANT_INITSCRIPT 230RELIANT_LOG_LIFE 226RELIANT_LOG_PATH 48, 227RELIANT_PATH 227RELIANT_SHUT_MIN_WAIT 227RELIANT_STARTUP_PATH 230Resource、属性 219rKind、属性 221RMS Wizard Tools ディテクタ

ログレベルの設定 55RMS 環境変数

AutoRecover の試行 230HV_APPLICATION 39, 230HV_APPLICATION_STATE_CHANGE_INFO、

スケーラブルコントローラ スクリプト 39HV_AUTORECOVER スクリプト AutoRecover の

試行 フラグ 39HV_AUTOSTARTUP 228HV_AUTOSTARTUP_IGNORE 224HV_AUTOSTART_WAIT 224HV_CHECKSUM_INTERVAL 225HV_COM_PORT 225HV_CONNECT_TIMEOUT 228HV_FORCED_REQUEST スクリプト 強制要求

フラグ 39, 231HV_HOST_STATE_CHANGE_INFO、スケーラブ

ルコントローラ スクリプト 39

268 J2UZ-5294-06Z0(03)

Page 277: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

索引

HV_LAST_DET_REPORT、スクリプト 後のディテクタレポート 39

HV_LAST_DET_REPORT、スクリプト 後のディテクタレポート 231

HV_LOG_ACTION 228HV_LOG_ACTION_THRESHOLD 225HV_LOG_WARN_THRESHOLD 225, 226HV_MAXPROC 229HV_MLOCKALL 229HV_NODENAME、スクリプト 現在のオブジェ

クトの名前 40HV_NODENAME、

スクリプト 現在のオブジェクトの名前 231HV_OFFLINE_REASON、スクリプト Offline

処理の理由 39HV_OFFLINE_REASON、

スクリプト Offline 処理の理由 231HV_RCSTART 229HV_REALTIMEPRIORITY 229HV_REQUESTING_CONTROLLER スクリプト

強制要求 フラグ 231HV_SCALABLE_CONTROLLER、スケーラブル

コントローラ スクリプト 231HV_SCALABLE_INFO、スケーラブルコント

ローラ スクリプト 231HV_SCRIPT_TYPE、スクリプトの種類 40, 231HV_SCRIPTS_DEBUG 229HV_SYSLOG_USE 229HV_USE_ELM 226NODE_SCRIPTS_TIME_OUT、スクリプト 現在

のオブジェクトのタイムアウト値 40, 231RELIANT_HOSTNAME 230RELIANT_INITSCRIPT 230RELIANT_LOG_LIFE 226RELIANT_LOG_PATH 48, 227RELIANT_PATH 227RELIANT_SHUT_MIN_WAIT 227RELIANT_STARTUP_PATH 230SCRIPTS_TIME_OUT 230

RMS 環境変数の設定の変更 223RMS コマンド

config.us 238hvassert 237hvattr 237hvcm 237hvconfig 237hvdisp 237hvdump 237hvenv.local 238hvgdstartup 238hvlogclean 237hvlogcontrol 237hvsetenv 237hvshut 237hvswitch 237hvutil 237

RMS リファレンスガイド 58rName、属性 221

SSA_blade.cfg 238SA_icmp.cfg 238SA_ipmi.cfg 238SA_pprci.cfg 238SA_rccu.cfg 238SA_SATxscf.cfg 238SA_SATxscf2.cfg 238SA_scon.cfg 238SA_sspint.cfg 238SA_sunF.cfg 238SA_vmchkhost.cfg 239SA_vmSPgp.cfg 239SA_vmSPgr.cfg 239SA_wtinps.cfg 238SCRIPTS_TIME_OUT 230ScriptTimeout、属性 219sdtool 238sfcipher 238ShutdownPriority、属性 219SplitRequest、属性 221sshconf 240StandbyCapable、属性 219StandbyTransitions、属性 219Standby 状態 211StateDetails、属性 221strace、Linux トレースツール 75switchlog 24

viewing 58ファイル 48, 49

switchlog エラーメッセージ 77SysNode

異常 24オブジェクトタイプ 213初期化 8ディテクタ 24

Ttruss、Solaris トレースツール 75

UUnknown 状態 211

終了 8初期状態 8

userApplication 8オブジェクトタイプ 213

WWait 状態 24, 211WarningScript、属性 220Warning 状態 211wvCntl 239wvGetparam 239wvSetparam 239wvstat 239

あアプリケーション

Offline になる 16切替え 25

J2UZ-5294-06Z0(03) 269

Page 278: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

索引

ウィザードデバッグレベル 56デバッグレポート 55

エラーOffline 状態 21初期化時 16処理 19

エラーメッセージ警告 179通知 205

メッセージ , エラー警告 179

エラーメッセージ 47BM ( ベースモニタ ) 48fatal 143switchlog 77コンソール 159

オブジェクトタイプandOp 213controller 213ENV 213ENVL 213gResource 213orOp 213SysNode 213userApplication 213

オフライン処理定義 16

オペレータ介入 24

か仮想ディスク

単独 253ミラー 255

関連マニュアル 2擬似デバイスドライバ 249切替え処理

定義 25クラスタ 1クラスタノード

オンラインを報告するまでの待ち時間 224起動時に無視 224リモートノードに対するディテクタの

タイムアウト 228警告エラーメッセージ 179高可用性 1故障状態からの回復 23コマンド

hvutil -c 23コンソールエラーメッセージ 159コントローラ

説明 213必須属性 213

さサブツリーの 上位 230指定切替え要求 25手動によるスクリプトの実行

RMS Wizard Tools 72状態

Deact 211Faulted 211Inconsistent 211Maintenance 211Offline 211OfflineFault 211Online 211Standby 211Unknown 211Wait 211Warning 211

初期化 8初期化、エラー時 16初期化スクリプト、指定 230初期状態

Unknown 状態 8初期化 8

スクリプトタイムアウト 230

属性Affiliation 220AlternateIp 215AutoRecover 215AutoRecoverCleanup 215AutoStartUp 215Class 220ClusterExclusive 216Comment 220ControlledSwitch 216DetectorStartScript 220FaultScript 216Halt 216HostName 220I_List 216LastDetectorReport 220LieOffline 217MaxControllers 220MonitorOnly 217NoDisplay 221NullDetector 221OfflineDoneScript 221OfflineScript 217OnlinePriority 217OnlineScript 217PartialCluster 218PersistentFault 218PostOfflineScript 218PostOnlineScript 218PreCheckScript 221PreOfflineScript 218PreOnlineScript 218PreserveState 218PriorityList 218Resource 219rKind 221rName 221ScriptTimeout 219ShutdownPriority 219SplitRequest 221StandbyCapable 219

270 J2UZ-5294-06Z0(03)

Page 279: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

索引

StandbyTransitions 219StateDetails 221WarningScript 220

ソフトウェアモニタ機能 1

たタイムアウト値の指定 227単独仮想ディスク 253致命的エラーメッセージ 143通知エラーメッセージ 205ツリーの 上位 スクリプト 39ディテクタ

無効 8ディレクトリ階層

ルートディレクトリ 227ルートディレクトリの指定 227

デバッグメッセージ 47BM ( ベースモニタ ) 48log ディレクトリ 48

デバッグレベル、ウィザード 56デバッグレポート、ウィザード 55

はハートビート 29ハートビートリカバリタイムアウト値 30フェイルオーバ 29物理ディスク

初期化時の状態 15

まマニュアル

関連 2マニュアルページ

表示 235ミラー仮想ディスク 255メッセージ 8

bmlog 49BM ( ベースモニタ ) 49RMS のトラブルシューティング 73エラー 48デバッグ 48汎用ディテクタログ 49

メッセージ、エラーfatal 143switchlog 77コンソール 159通知 205

や優先切替え

要求 25要求 8

Offline 16

らログファイル

BM ( ベースモニタ ) 49switchlog 24, 49ディレクトリの指定 227

保持期間 226ログレベル

ディテクタ、RMS Wizard Tools のログレベルの設定 55

J2UZ-5294-06Z0(03) 271

Page 280: RMS リファレンスガイド 4 - Fujitsusoftware.fujitsu.com/jp/manual/manualfiles/m140010/j2uz...本書は、RMS の構成、運用時に発生したトラブルの原因と対処方法を説明します。読者は、PCS、RMS

索引

272 J2UZ-5294-06Z0(03)