78
IBM DS8000 快速维护手册 V1.5 1

IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

  • Upload
    others

  • View
    26

  • Download
    0

Embed Size (px)

Citation preview

Page 1: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

IBM DS8000 快速维护手册

V1.5

1

Page 2: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

版本历史:

1.1 增加了如何区分哪一个 LPAR 的 State Saves 的说

增加了收集 AIX Crash Dump 的步骤

2006/10/2

1.2 增加了 IBM Publications Center 出版物中心的下

增加了对关闭 Serviceable Event 的解释

修改了关机的步骤,增加了对 DDM 故障类型的

2006/12/27

1.4 增加了 64.xx 或以上微码的 HMC 截图 2011-8-30

1.5 重新整理并修订截图,修改了部分内容 2011-9-28

说明:本文档仅供参考,并不能取代 IBM 的官方文档。

1. 对于一线工程师,任何 Service 都应首先参考 DS8000 Service Information Center:

http://publib.boulder.ibm.com/infocenter/dsichelp/ds8000sv/index.jsp

2. 以下是一些在对 DS8000 做服务之前应该参考的文档

Redbook:

IBM System Storage DS8000: Architecture and Implementation SG24-8886-01

以下一些产品手册需要下载以备不时之需:

IBM System Storage DS8000 Introduction and Planning Guide

IBM System Storage DS8000 Installation Guide (DS8000 新装机必读的文档)

IBM System Storage DS8000 Command-Line Interface User’s Guide (DSCLI 命令手册)

IBM System Storage DS8000 Host Systems Attachment Guide

IBM System Storage DS8000 Messages Reference

IBM System Storage DS8000 User’s Guide

产品手册公网下载地址:

http://www-947.ibm.com/support/entry/portal/Documentation

3. DS8000 Field Tips Web site

Service Matrix, 微码升级 Guide,MES 最低要求微码版本以及 MES guide,常见 Tips 等。

针对 DS8000/DS8700/DS8800,分别有 3 个网站:

DS8000:

http://ssgtech3.tucson.ibm.com/S96A/DS8000%20PE%20Field%20Tips.nsf/wvByCategory?

OpenView

DS8700:

http://ssgtech10.tucson.ibm.com/Q4JA/DS8700%20PE%20Field%20Tips.nsf

DS8800:

http://ssgtech10.tucson.ibm.com/Q4JA/DS8800%20PE%20Field%20Tips.nsf

4. DS8000 微码以及 DSCLI 下载 FTP 公网站点:

ftp://ftp.software.ibm.com/storage/ds8000/updates/

下载微码有两种方法:

方法一:

直接下载整个 Bundle 的 DVD 镜像文件并刻录 DVD。镜像文件存放在上述 FTP 站点的

DVD_BUNDLE 目录下。

2

Page 3: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

ftp://ftp.software.ibm.com/storage/ds8000/updates/DVD_BUNDLE/

方法二:

使用 CDA4TP 软件下载微码和上传到 HMC,建议使用该软件对同一个版本下载两次,第

二遍该软件将自动对微码文件做 checksum 完整性校验而并不会重复下载。

CDA4TP 软件的下载地址和具体用法:

http://w3.tap.ibm.com/w3ki/display/cda4tp/Home

5. DS8000 的 SSR 必需培训自学教材:

IBM 2107 (DS8000) Service Training 课程代码:SE210701

IBM 2107 (DS8000) Service Update Training 课程代码:SE210702

IBM 242x System Storage DS8000 Service Training 课程代码:SE242X00

IBM DS8000 Release 4.0 Field Update Training 课程代码:SE242X01

IBM DS8000 Release 4.2 Field Update Training 课程代码:SE242X02

IBM DS8700 SSR Update Training 课程代码:SE242X03

IBM DS8800 SSR Update Training 课程代码:SE242X04

IBM DS8800 Release 6.1 Field Update Training 课程代码:SE242X05

注意:本文档仅供 IBM 内部使用,不能提

供给客户或 BP。请大家保护 IBM 的知识产

权,不要把内部使用的文档放上公网。

3

Page 4: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

目 录

IBM DS8000 快速维护手册 ...........................................................................................................1

目 录.........................................................................................................................................4

前言 ..................................................................................................................................................5

一、如何查看Open Serviceable Event?(63.xx或以下微码) ...................................................5

二、如何查看Open Serviceable Event?(64.xx或以上微码) ...................................................7

三、如何查看DS8000 的微码版本(微码 63.xx或以下版本) .................................................11

四、如何查看DS8000 的微码版本(微码 64.xx或以上版本) .................................................13

五、如何运行“View Storage Facility State/End-of-Call” (63.xx或以下微码) ....................15

六、如何运行“View Storage Facility State/End-of-Call” (64.xx或以上微码) ....................17

七、如何关闭Serviceable Event (微码 63.xx或以下版本) ....................................................18

八、如何关闭Serviceable Event (微码 64.xx或以上版本) ....................................................20

九、运行CdaPreVerify进行微码升级前的健康检查(微码 63.xx或以下版本) .....................21

十、运行CdaPreVerify进行微码升级前的健康检查(微码 64.xx或以上版本) .....................24

十一、如何检查RIO的环路状态(微码 63.xx或以下版本) ....................................................27

十二、如何检查RIO的环路状态(微码 64.xx或以上版本) ....................................................29

十三、如何收集PE Package(微码 63.xx或以下版本) ............................................................31

十四、如何收集PE Package(微码 64.xx或以上版本) ............................................................36

十五、如何收集State Save和AIX Dump(微码 63.xx或以下版本) ........................................42

十六、如何收集Lpar State Save(微码 64.xx或以上版本)......................................................46

十七、DS8000 日志文件(PE Package、State Save等)的上传地址和格式 ...........................48

十八、如何配置CALL HOME和HMC的RSF(微码 63.xx或以下版本) ................................49

十九、如何配置CALL HOME和HMC的RSF(微码 64.xx或以上版本) ................................57

二十、如何备份HMC的Critical Console Data(微码 63.xx或以下版本) ...............................65

二十一、如何备份HMC的Critical Console Data(微码 64.xx或以上版本) ...........................66

二十二、如何关闭DS8000 基本柜上的黄色故障灯(微码 63.xx或以下版本) .....................66

二十三、如何关闭DS8000 基本柜上的黄色故障灯(微码 64.xx或以上版本) .....................68

二十四、如何将DS8000 关闭和加电(微码 63.xx或以下版本) .............................................70

二十五、如何将DS8000 关闭和加电(微码 64.xx或以上版本) .............................................72

二十六、如何查看DDM的微码(微码 63.xx或以下版本)......................................................73

二十七、如何查看DDM的微码(微码 64.xx或以上版本)......................................................75

二十八、如何退出及关闭HMC(微码 64.xx或以上版本) ......................................................78

4

Page 5: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

前言

DS8000 的 HMC 管理界面因微码版本不同分为两种,微码版本 63.xx.及以下版本的 HMC 管

理界面为 GUI(基于 Java WebSM),微码版本 64.xx 及以上版本的 HMC 管理界面为 WUI

(基于 Web 浏览器)。两种 HMC 的管理界面差异比较大。

因此本文档大部分的操作和截图,都会对两种微码版本的 DS8000 分别做说明。

一、如何查看Open Serviceable Event?(63.xx或以下微码)

1. 登录 HMC。用户名和密码如下:

用户名:CE

密码: serv1cece (中间为数字 1)

2. 选择 Service Focal Point 中的 Manage Serviceable Events:

3. 默认选项是只查看“OPEN”的 Service Event:

5

Page 6: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

6

4. 正常情况下不应该有 OPEN 的 Service Event:

5. 如果有 OPEN 的 Service Event,可以看到 Event 的 ID、SRC 号码、首次发现时间和最

后一次的发现时间。可以选择“View Details”查看 Event 的 Detail:

Page 7: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

6. 可以看到 Event 所指向的备件号、描述和位置号 Location Code:

注意:并不是每一种 Event 都会使 DS8000 的故障灯亮起。因此就算故障灯没有亮起,都要

的设计,每一个 DA Pair 里面由于坏盘增多而少于 2 块热备盘的

故障灯是否亮

,必须检查 HMC 有没有 Open Event 并且做 End-Of-Call。

二、如何查看Open Serviceable Event?(64.xx或以上微码)

录界面提供了一个新功能。用户可以在登录前就通过 3 个基本指

标确

System Status:

HMC 所连接的 DS8000 的 CEC 控制器状态正常就显示打勾

查看 Open Service Event 和运行 End Of Call!!!

特别注意:有很多 Open Event 在产生之后,DS8000 的故障灯都不会亮起。特别是单块硬

盘的故障。(例如按照微码

时候,故障灯才会亮起)

所以工程师在巡检 DS8000 的时候,千万不要只是检查主面板的

1. 64.xx 或以上微码的登

认机器的基本状态。

3 个基本指标分别是

C 常就显示打叉EC 控制器状态不正

Attention LEDs:

亮起就显示打勾DS8000 的主故障灯没有 ,主故障灯亮起就显示感叹号

Serviceable Events:

S8000 没有 Open Event 就显示打勾D ,有 Open Event 就显示一个扳手

一切正常的登录前界面如下:

7

Page 8: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

8

有 Open Serviceable Event 的典型界面如下,表明有 Open Event,故障灯也亮起了:

特别注意:有很多 Open Event 在产生之后,DS8000 的故障灯都不会亮起。特别是单块硬

盘的故障。(例如按照微码的设计,每一个 DA Pair 里面由于坏盘增多而少于 2 块热备盘的

时候,故障灯才会亮起)

所以工程师在巡检 DS8000 的时候,千万不要只是去看主面板的故障灯,必须检

查 HMC 有没有 Open Event 并且做 End-Of-Call。。

Page 9: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

2. 点击“Log on and Launch the Hardware Management Console web application”登录 HMC。

用户名和密码如下:

用户名:CE

密码: serv1cece (中间为数字 1)

3. 如果有 Open Serviceable Event,HMC 界面左下角的红色扳手图标将会亮起,直接点击

该图标即可。

4. 默认选项是只查看“OPEN”的 Serviceable Event:

9

Page 10: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

5. 如果有 OPEN 的 Serviceable Event,可以看到 Event 的 ID、SRC 号码、首次发现时间和

最后一次的发现时间。可以选择“View Details”查看 Event 的 Detail:

6. 可以看到 Event 所指向的备件号、描述和位置号 Location Code:

7. 如果没有 Open Serviceable Event,HMC 界面左下角的红色扳手图标将不会显示成红色,

也不需要去点击查看。

10

Page 11: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

11

三、如何查看DS8000 的微码版本(微码 63.xx或以下版本)

1. 打开Licensed Internal Code Maintenance下面的Change Internal Code,选择相应的Storage

Facility

2. 选择 Update and Recovery Utilities 下面的“Display Installed Code Levels …”

3. 结果如下:在输出最底部的Code Installation History位置,找到最新日期的 Package:

SEA.sfi , MTMS:xxxx对应的Bundle VRMF: xx.xx.xx.x 即整个Bundle的版本。下面的例

子显示的Bundle版本是 62.42.95.0。

Page 12: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

12

4. 快速查看整体 Bundle 版本的办法如下:

1) 打开Licensed Internal Code Maintenance下面的Change Internal Code,选择相应的Storage

Facility,选择 Update and Recovery Utilities 下面的 Recovery Utilities

2) 选择“Display CDA SFI Attributes”

Page 13: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

13

3) 选择的相应的 SFI,点 Okay

4) 弹出的窗口将显示出 Bundle 版本,图例是 6.1.600.59,点 Okay 可以退出。

四、如何查看DS8000 的微码版本(微码 64.xx或以上版本)

1. 打开 Updates 菜单

2. 选择的相应的 Storage Facility

3. 选择“Display Storage Facility Code Levels”

Page 14: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

14

4. 在输出最底部的Code Installation History位置,找到最新日期的 Package: SEA.sfi ,

MTMS:xxxx对应的Bundle VRMF: xx.xx.xx.x 即整个Bundle的版本。下面的例子显示的

Bundle版本是 62.42.95.0。

Page 15: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

五、如何运行“View Storage Facility State/End-of-Call” (63.xx或以下微码)

View Storage Facility State 也叫做 End-of-Call (EOC),是检查 DS8000 状态的基本方法。

注意:工程师做完任何 DS8000 的硬件维护,都必须运行 EOC 来确认机器工作正常!

1. 打开 Service Focal Point,选择 Service Utilities

2. 在弹出的窗口中选中相应的 Storage Facility

3. 在“Selected”菜单中选择“View Storage Facility State”

15

Page 16: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

16

4. 系统检查会运行 5 至 10 分钟:

5. 结果如下。检查其中每一项的 Status,如果出现 FAILED 的状态,就需选择该行并点

“Details”按钮查看详细情况。PASSED 状态则表示该项检查没有问题。图例中全部检

查结果都是 PASSED。

Page 17: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

六、如何运行“View Storage Facility State/End-of-Call” (64.xx或以上微码)

View Storage Facility State 也叫做 End-of-Call (EOC),是检查 DS8000 状态的基本方法。

注意:工程师做完任何 DS8000 的硬件维护,都必须运行 EOC 来确认机器工作正常!

1. 打开 Storage Facility Management,选择相应的 Storage Facility,在 Service Utilities 菜单

下选择“View Storage Facility State”

2. 系统检查会运行 5 至 10 分钟:

3. 结果如下。检查其中每一项的 Status,如果出现 FAILED 的状态,就需选择该行并点

“ Details ”按钮查看详细情况。 PASSED 状态则表示该项检查没有问题。

17

Page 18: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

18

七、如何关闭Serviceable Event (微码 63.xx或以下版本)

注意:

如果 Event 有指向某个 FRU,那么如果其指向的备件通过 HMC 操作的方式被更换,该 Event

是会被自动关闭的。

在人为关闭 Event 之前,必须通过“View Storage Facility State”和“CdaPreVerify”确认机

器的工作状态正常,也可以咨询本地的 Top Gun 或 TSG。

如果误关闭一个未解决的 Event,DS8000 会在周期性自检的时候重新报出。根据不同的部

件,自检一次的周期从半小时到一天不等。

1. 点击相应的 Event,选择“Close Event”

Page 19: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

19

2. 输入评语的窗口会自动弹出,可以点击“Close Events”跳过 Comment,直接关闭 Event

3. 结果如下:

Page 20: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

八、如何关闭Serviceable Event (微码 64.xx或以上版本)

1. 点击相应的 Event,选择“Close Event”

4. 输入评语的窗口会自动弹出,可以点击“Close Events”跳过 Comment,直接关闭 Event

20

Page 21: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

21

5. 结果如下:

九、如何运行CdaPreVerify进行微码升级前的健康检查(微码 63.xx或以下版本)

CdaPreVerify 是一个对 DS8000 进行微码升级前的健康检查工具,一般建议在微码升级前

才运行。

注意:CdaPreverify 不要与 EOC 同时运行,同时运行可能对 DS8000 的性能产生影响!

1. 打开 Licensed Internal Code Maintenance 下面的 Change Internal Code

Page 22: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

22

2. 选择相应的 Storage Facility

3. 选择 Update and Recovery Utilities 下面的 Recovery Utilities

Page 23: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

4. 选择 Run CdaPreVerify

CdaPreVerify 大约运行 5-10 分钟,之后会出现对话框提示检查完毕

5. 点击 OK,出现结果如下。注意仔细观察每一项的结果都是“Passed”,最后总的结果也

是“Passed”:“Passed full system scan by SFI”

23

Page 24: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

24

十、如何运行CdaPreVerify进行微码升级前的健康检查(微码 64.xx或以上版本)

CdaPreVerify 是一个对 DS8000 进行微码升级前的健康检查工具,一般建议在微码升级前

才运行。

注意:CdaPreverify 不要与 EOC 同时运行,同时运行可能对 DS8000 的性能产生影响!

1. 打开 HMC 的 Updates 菜单

2. 选择相应的 Storage Facility

Page 25: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

25

6. 选择 Run CdaPreVerify

CdaPreVerify 大约运行 5-15 分钟(取决于机器配置的大小)

7. 如果 CdaPreVerify 没有检测到故障,顺利通过,会出现以下界面:

Page 26: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

8. 点击 OK,出现结果如下。注意仔细观察每一项的结果都是“Passed”,最后总的结果也

是“Passed”:“Passed full system scan by SFI”

9. 如果 CdaPreVerify 检测到故障不能 Passed,会出现以下界面:

10. 点击 OK,出现结果如下。你可以看到 CdaPreVerify 检测工具是在哪一项检查上失

败的。

26

Page 27: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

27

十一、如何检查RIO的环路状态(微码 63.xx或以下版本)

1. 打开 Service Focal Point 中的“Service Utilities”,选择“Get SF Systems”

Page 28: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

2. 选中第一台 P570 之后,选择“View RIO Topology”

3. 结果如下,注意确认所有 RIO 总线的 Link Status 都是“Operational”,Link Speed 都是

“1GB/sec”(有部分 RIO 线会显示“UNKNOWN CABLE LENGTH”,这是正常的):

4. 必须在另外一台 P570 上面重复一次查看操作,确保结果也正常

28

Page 29: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

十二、如何检查RIO的环路状态(微码 64.xx或以上版本)

1. 打开 Storage Facility Management,选择相应的 Storage Facility,在 Service Utilities 菜单

下选择“View Hardware Topology”

2. 注意确认所有 RIO 总线的 Link Status 都是“Operational”,Link Speed 都是“1GB/sec”。

如果是 DS8700 或 DS8800,还可以看到 PCIe 链路的状态。确认所有 PCIe 的链路状态

都是“OK”。

29

Page 30: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

30

Page 31: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

十三、如何收集PE Package(微码 63.xx或以下版本)

1. 选择“Service Focal Point”中的“Service Utilities”:

2. 选择“Get Storage Facility Image”

3. 点击相应的 Storage Facility Image ,选择“Perform Data Collection On Demand…”

4. 一定要将“Auto Offload”选项取消掉,点击 OK 继续:

31

Page 32: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

32

PE Package 的收集会运行大约 10 分钟:

5. 收集结束后,弹出如下窗口。用 Ctrl-A 键全选所有文件,按“Offload”将所有文件打

包,然后继续:

6. Offload 完成之后,会弹出一个提示框,表示 PE Package 的收集将会生成一个 SRC 为

“BEB00010”的 Serviceable Event,点 OK 继续:

Page 33: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

33

选择“Cancel”继续

7. 打开 Service Focal Point,查看 Open 的 Serviceable Events,会看到一个 SRC 为

“BEB00010”的 Event,就是 Offload PE Package 所产生的:

8. 点击该 Event 后,选择 Manage Problem Data

Page 34: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

34

9. 弹出的窗口会列出所有之前生成的 Package 文件,如果机器已经配置了 Call Home(目

的地址为工程师的笔记本上的 ftp server IP),可以选择 CTRL+A 全选文件后,点击 Call

Home.

如果要使用 Offload to Media,根据最终选择介质的不同,文件选择方式有两种:

DVD 方式: 使用 CTRL+A 全选所有文件,将随机付送的 DVD 放入 HMC 的 DVD-RAM 中,

点击“Save to DVD”将 PE Package 保存到 DVD 中

U盘:请选择任何一个结尾是problem number.zip的文件就可以正确收集到数据。比如:如果你

的问题号是64,选择任何一个形如****in 64.zip的文件后,点击Offload to media就可以了。

注意: 使用USB设备下载数据的常见问题: 1.USB识别问题 正常情况下,U盘插入后机器前面的USB插孔后,当大家听到3声“嘀、嘀、嘀”后,表明HMC

可以正确识别你的USB设备。

并不是所有类型的USB设备,HMC都支持,我们发现有的USB stick插入后,HMC会hung

大概10分钟,这样的USB就无法使用。

有的U盘插入后,HMC第一次没有反应,拔出后,再插入,HMC变可以正确识别。

另外,HMC前部有2个USB插口,如果你的USB在第一个无法被HMC识别,请试验另外一

个插口。

Page 35: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

2.收集数据的时候,数据不完整 一般情况下,我们在如下图的界面中选择数据的时候,都是CTRL+A全选,但是我们发现,对于

用U盘收集数据,如果全选的话,只能收集到第一个文件,一般字节很小,不是我们想要的数据。

3.收集到的数据,文件名不正确 正常情况下,数据文件的的后缀应该为*.sslpr.zip和*.pepck.zip,有时候用USB收集的数据扩

展名为*.eed.zip。这个时候,你可以用USB在收集几次,有时候就可以得到正确的文件名。如

果仍旧有问题,你可以在笔记本上打开这个eed.zip文件,确认里面的内容是否正确,如果包含

了正确的数据,直接将该文件rename成正确扩展名即可。

一般情况下,正确的PE pkg大小为几十MB到100多MB,包含如下10个文件:

-------- ---- ---- ----

6460 10-16-08 04:15 collectedCodeLevels.All.2107-931-75DG450.htm

2121 10-16-08 04:15 collectedCodeLevels.All.7978PEN-KDMCVPH.htm

70662 10-16-08 09:29 CasTrace

19962380 10-16-08 09:29 HMCa.unzipthis

4913159 10-16-08 09:29 Lpar0.tar.gz

4633094 10-16-08 09:29 Lpar1.tar.gz

280 10-16-08 09:29 SFI-1.info

7751446 10-16-08 09:26 ctsnap.SF75DG450ESS01.10160925.tar.gz

10492364 10-16-08 09:28 ctsnap.SF75DG450ESS11.10160927.tar.gz

4300987 10-16-08 09:24 ctsnap.localhost.10160923.tar.gz

-------- -------

52132953 10 files

正确的lpar statesave大小为几个MB,包含如何三个文件:

Length Date Time Name

-------- ---- ---- ----

6460 09-19-08 04:15 collectedCodeLevels.All.2107-931-75DG450.htm

1381 09-19-08 04:15 collectedCodeLevels.All.7978PEN-KDMCVPH.htm

5107832 09-19-08 09:48 cpssdump01.080918_140212.1.1.tar.gz

-------- -------

5115673 3 files

当一个lpar down的时候,收集到的PE pkg将缺少对应的lpar数据,这种情况下,PE pkg将包含

8个或者8+1=9个文件,如下:

Length Date Time Name

-------- ---- ---- ----

6460 10-17-08 04:15 collectedCodeLevels.All.2107-931-75DG450.htm

2121 10-17-08 04:15 collectedCodeLevels.All.7978PEN-KDMCVPH.htm

77649 10-17-08 15:29 CasTrace

21741375 10-17-08 15:29 HMCa.unzipthis

8672047 10-17-08 15:29 Lpar0.tar.gz

35

Page 36: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

280 10-17-08 15:29 SFI-1.info

8051310 10-17-08 15:28 ctsnap.SF75DG450ESS01.10171528.tar.gz

4345654 10-17-08 15:27 ctsnap.localhost.10171527.tar.gz

70 10-17-08 15:33 file0_deactivatedLparsList_1224228404662.log -------- -------

42896966 9 files

十四、如何收集PE Package(微码 64.xx或以上版本)

1. 选择 Storage Facility Management,选择相应的 Storage Facility,在 SF Image#1 菜单界

面下选择“Data Collection Tasks”

2. 选择选择“Perform Data Collection On Demand…”

36

Page 37: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

37

3. 选择选择“General PE Package”

4. 选择选择“New General Pakage”, 一定要将“Auto Offload”选项取消掉,点击 OK 继

续:

PE Package 的收集会运行大约 15 分钟:

Page 38: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

38

5. 收集结束后,弹出如下窗口。用 Ctrl-A 键全选所有文件,按“Offload”将所有文件打

6. Offload 完成之后,会弹出一个提示框,表示 PE Package 的收集将会生成一个 SRC 为

“BEB00010”的 Serviceable Event,点 OK 继续:

Page 39: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

39

选择“Cancel”继续

7. 打开 Service Focal Point,查看 Open 的 Serviceable Events,会看到一个 SRC 为

“BEB00010”的 Event,就是 Offload PE Package 所产生的:

8. 点击该 Event 后,选择 Manage Problem Data

Page 40: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

40

9. 弹出的窗口会列出所有之前生成的 Package 文件,用 Ctrl-A 全选所有文件:

10. 选择“Offload to Media”

U 盘方式(推荐):

将 U 盘放入 HMC 的 USB 插槽中,等待 10 秒,直到听到 HMC 在识别 U 盘后自动发出的

三声“嘀”的声音。如果听不到三声“嘀”的声音,表明 HMC 没有正确的识别 U 盘,可

能需要将 U 盘重新插拔一下。

点击“Copy to USB memory stick”将 PE Package 保存到 U 盘中。

Page 41: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

41

DVD 方式:

也可以选择“Offload to DVD-RAM media”,把数据保存到 HMC 的 DVD 里面。

注意: 使用USB设备下载数据的常见问题: 1.USB识别问题 正常情况下,U盘插入后机器前面的USB插孔后,当大家听到3声“嘀、嘀、嘀”后,表明HMC

可以正确识别你的USB设备。

并不是所有类型的USB设备,HMC都支持,我们发现有的USB stick插入后,HMC会hung

大概10分钟,这样的USB就无法使用。

有的U盘插入后,HMC第一次没有反应,拔出后,再插入,HMC变可以正确识别。

另外,HMC前部有2个USB插口,如果你的USB在第一个无法被HMC识别,请试验另外一

个插口。

2.收集数据的时候,数据不完整 一般情况下,我们在如下图的界面中选择数据的时候,都是CTRL+A全选,但是我们发现,对于

用U盘收集数据,如果全选的话,只能收集到第一个文件,一般字节很小,不是我们想要的数据。

3.收集到的数据,文件名不正确 正常情况下,数据文件的的后缀应该为*.sslpr.zip和*.pepck.zip,有时候用USB收集的数据扩

展名为*.eed.zip。这个时候,你可以用USB在收集几次,有时候就可以得到正确的文件名。如

果仍旧有问题,你可以在笔记本上打开这个eed.zip文件,确认里面的内容是否正确,如果包含

了正确的数据,直接将该文件rename成正确扩展名即可。

一般情况下,正确的PE pkg大小为几十MB到100多MB,包含如下10个文件:

-------- ---- ---- ----

6460 10-16-08 04:15 collectedCodeLevels.All.2107-931-75DG450.htm

2121 10-16-08 04:15 collectedCodeLevels.All.7978PEN-KDMCVPH.htm

70662 10-16-08 09:29 CasTrace

19962380 10-16-08 09:29 HMCa.unzipthis

4913159 10-16-08 09:29 Lpar0.tar.gz

4633094 10-16-08 09:29 Lpar1.tar.gz

280 10-16-08 09:29 SFI-1.info

7751446 10-16-08 09:26 ctsnap.SF75DG450ESS01.10160925.tar.gz

Page 42: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

10492364 10-16-08 09:28 ctsnap.SF75DG450ESS11.10160927.tar.gz

4300987 10-16-08 09:24 ctsnap.localhost.10160923.tar.gz

-------- -------

52132953 10 files

正确的lpar statesave大小为几个MB,包含如何三个文件:

Length Date Time Name

-------- ---- ---- ----

6460 09-19-08 04:15 collectedCodeLevels.All.2107-931-75DG450.htm

1381 09-19-08 04:15 collectedCodeLevels.All.7978PEN-KDMCVPH.htm

5107832 09-19-08 09:48 cpssdump01.080918_140212.1.1.tar.gz

-------- -------

5115673 3 files

当一个lpar down的时候,收集到的PE pkg将缺少对应的lpar数据,这种情况下,PE pkg将包含

8个或者8+1=9个文件,如下:

Length Date Time Name

-------- ---- ---- ----

6460 10-17-08 04:15 collectedCodeLevels.All.2107-931-75DG450.htm

2121 10-17-08 04:15 collectedCodeLevels.All.7978PEN-KDMCVPH.htm

77649 10-17-08 15:29 CasTrace

21741375 10-17-08 15:29 HMCa.unzipthis

8672047 10-17-08 15:29 Lpar0.tar.gz

280 10-17-08 15:29 SFI-1.info

8051310 10-17-08 15:28 ctsnap.SF75DG450ESS01.10171528.tar.gz

4345654 10-17-08 15:27 ctsnap.localhost.10171527.tar.gz

70 10-17-08 15:33 file0_deactivatedLparsList_1224228404662.log -------- -------

42896966 9 files

十五、如何收集State Save和AIX Dump(微码 63.xx或以下版本)

在 DS8000 里面可以收集很多不同类型的 State Save 文件

1. LPAR State Save

1) 和收集 PE Package 一样,在 Service Focal Point 的 Service Utilities 里面,选择“Get Storage

Facility Images”

42

Page 43: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

43

2) 选中相应的 Image 之后,选择“selected”菜单中的“Process LPAR State Saves…”

3) 列表中列出了当前保存的所有 LPAR State Saves,根据 L2/PFE 在 PMH 中的指示,选择

相应的 State Save 文件,点击“offload”

注意:

以 x.0.tar.zip 结 尾 的 文 件 是 LPAR:ESS01 的 State Saves 文 件 , 例 如

cpssdump08.060825_154102.1.0.tar.zip

以 x.1.tar.zip 结 尾 的 文 件 是 LPAR:ESS11 的 State Saves 文 件 , 例 如

cpssdump08.060825_154105.1.1.tar.zip

ESS01 是上面的 P570 控制器

ESS11 是下面的 P570 控制器

Page 44: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

44

注意:在没有得到 L2/PFE 的批准前,不能点击“Generate State Saves”。

等待 Offload 结束

4) Offload 完成之后,会弹出一个提示框,表示 LPAR State Save 的收集将会生成一个 SRC

为“BEF00015”的 Serviceable Event,点 OK 继续

5) 剩下的操作,和收集 PE Package 一样,查看 Open 的 Serviceable Events,对相应的 SRC

为“BEF00015”的 Event 进行“Manage Problem Data”的操作,进而参照 PE package

的方式通过 DVD 或者 U 盘下载。

2. DA State Save (也叫 ISS Dump,这个 State Save 在分析 DA 卡的故障时往往需要上传)

1) 和收集 PE Package 一样,在 Service Focal Point 的 Service Utilities 里面,选择“Get Storage

Facility Images”。选中相应的 Image 之后,选择“selected”菜单中的“Process ISS DA State

Saves…”

Page 45: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

45

2) 列表中列出了当前保存的所有 ISS DA State Saves,根据 L2/PFE 在 PMH 中的指示,选

择相应的 State Save 文件,点击“offload”

注意:在没有得到 L2/PFE 的批准前,不能点击“Generate State Saves”。

等待 Offload 结束

3) Offload 完成之后,会弹出一个提示框,表示 ISS DA State Save 的收集将会生成一个 SRC

为“BEF00020”的 Serviceable Event,点 OK 继续

Page 46: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

46

剩下的操作,和收集 PE Package 一样,查看 Open 的 Serviceable Events,对相应的 SRC 为

“BEF00020”的 Event 进行“Manage Problem Data”的操作,进而参照 PE package 的方式

通过 DVD 或者 U 盘下载。

十六、如何收集Lpar State Save(微码 64.xx或以上版本)

1. 选择 Storage Facility Management,选择相应的 Storage Facility,在 SF Image#1 菜单界

面下选择“Process LPAR State Saves”

2. 列表中列出了当前保存的所有 LPAR State Saves,根据 L2/PFE 在 PMH 中的指示,选择

相应的 State Save 文件,点击“offload Existing State Saves”

注意:

以 x.0.tar.zip 结 尾 的 文 件 是 LPAR:ESS01 的 State Saves 文 件 , 例 如

cpssdump06.110527_065211.1.0.tar.gz

以 x.1.tar.zip 结 尾 的 文 件 是 LPAR:ESS11 的 State Saves 文 件 , 例 如

cpssdump06.110527_065210.1.1.tar.gz

Page 47: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

ESS01 是上面的 P570 控制器

ESS11 是下面的 P570 控制器

3. 勾选“Disable auto data offload”

注意:在没有得到 L2/PFE 的批准前,不能点击“Generate State Saves”。

等待 Offload 结束

4. Offload 完成之后,会弹出一个提示框,表示 LPAR State Save 的收集将会生成一个 SRC

为“BEF00015”的 Serviceable Event,点 OK 继续

47

Page 48: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

48

5. 剩下的操作,和收集 PE Package 一样,查看 Open 的 Serviceable Events,对相应的 SRC

为“BEF00015”的 Event 进行“Manage Problem Data”的操作,进而参照 PE package

的方式通过 U 盘或 DVD 下载。

十七、DS8000 日志文件(PE Package、State Save等)的上传地址和格式

名方式),该地址为公网 IP,不需要进入 IBM VPN

网,因此也可以由客户的机器上传。

p://testcase.software.ibm.com/ssd/toibm/sharkdumps/

上传地址:美国的 Testcase FTP 服务器(匿

ft

件(zip 格式),都必须先严格遵循以下命名规则重新命名,然后才能上传 Testcase

,这个地方不需要改动(对于 DVD

要填 48168

ss,例如 060825173702

trace, pepck, ssddm, ssiss, sslpr, ssphp

e 的类型是“ssiss”

.gx_mcc.25.48168.060827131621.cl8.pepck.zip”重新上传。千万不能改变

文件名的格式。

所有日志文

服务器:

MTMS.customername.problemnumber.pmh.timestamp.cluster.type.extension MTMS: 7 位机器型号紧接着 7 位机器序列号,例如 210792275AMMZ0

customername: 最多 15 个字符的客户名字,不能有空格,例如 gd_mobile 或

problemnumber: 最多 3 位的 Serviceable Event ID

刻录方式获得的日志文件 19.zip,19 就是 Event ID)

pmh: 5 位的 PMH 号码,如果 PMH 是 48168,000,672,则只需

timestamp: 时间,格式是:YYMMDDhhmm

cluster: 只能使用“cl9”或者“cl8”

type: 总共有 8 种类型: dump, heartb, dump

常 类型: PE Package 的类型是“pepck”

LPAR State Save 的类型是“sslpr”

ISS DA State Sav

extension: 必须是“zip”

例子如下: 210792175bxvt0.gx_mcc.25.48168.060827131620.cl8.pepck.zip

210792275CBYK0.amex_log05.179.11992.060826133547.cl9.sslpr.zip

Tips:如果上传过程中发生中断,是不能断点续传的,可以将时间戳的秒位修改重新上传。

例如 PEPKG 文件:“210792175bxvt0.gx_mcc.25.48168.060827131620.cl8.pepck.zip”,在上

传 过 程 中 发 生 了 中 断 , 我 们 可 以 将 文 件 名 改 成

“210792175bxvt0

Page 49: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

十八、如何配置CALL HOME和HMC的RSF(微码 63.xx或以下版本)

Notes:配置 Call Home 前,必须提前一天将 DS8000 的主柜、扩展柜型号、序列号,以及

机器的装机日期,通知相关人员把相关序列号在RETAIN系统中注册,方能实现Call Home,

并生成 PMH。

SSR 可以在 RETAIN 里面参照以下步骤来确认某个机柜是否已经注册:

登录 RETAIN, 输入命令“n;z/cpu NNNNSSSSSSS”

NNNN 是机柜的 M/T,例如 2107,2421,2422,2423,2424

SSSSSS 是机柜的 6 位序列号,例如 75SN888(注意每个扩展柜有自己的序列号)。

如果可以搜到这个机柜,那么就表明这个机柜已经被注册。

如果返回“UNKNOWN CPU SPECIFIED”,那么就表明这个机柜还没有在 RETAIN 里注册。

选择 1,查看注册的具体记录,Status 的位置必须是数值“2”、“9”或者“1”。

49

Page 50: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

1. 打开 Remote Support,选择“Customize Customer Information”(在配置 CALL HOME

之前,这一步必须先完成)

2. 只需要填写“Administrator”页,“System”页勾选与 Administrator 相同信息即可,

“Account”页不需要填写。带*号的地方一定要填写

50

Page 51: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

51

3. 配置 CALL HOME(Customize Outbound Connectivity)

1) 打开 Remote Support,选择“Customize Outbound Connectivity

2) 勾选“Enable Local System as Call Home Server”

3) 如果是使用 Modem 电话线 Call Home,就打开“Local Modem”页,勾选“Allow dialing

using the local modem”,从列表中选择系统提供的电话号码。也可以尝试手工输入另外

2 个电话号码:16970(中国北方)和 400-6744444(中国南方)。

Page 52: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

最后点击“OK”完成,关闭窗口

4) 如果该电话线是分机,则点击“Modem Configuration…”,打开“Customize Modem

Setting”页,在“Dial Prefix”填写拨号前缀,例如 9 或 0。如果打外线是直拨就不

需要执行这一步

5) 如果是使用 VPN Call Home,就打开“Internet VPN”页,勾选“Allow a VPN using an

existing Internet connection”

6) 可以点击“Test”进行VPN连接测试 (该Test只是测试连通性,不会产生Call Home PMH)

52

Page 53: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

7) 点击“Start”开始测试,直到出现“Test Completed Successfully”,表明连接性测试成功

4. Call Home 生成 PMH 测试

Notes:启用 Call Home 的机器,务必进行该测试,该测试通过,方能证明所有设置正确!

Select Service Application > Service Focal Point > Service Utilities.

Click on the storage facility that you are installing.

From the Selected drop down, click on “ Test problem notification (PMH, SNMP, Email).”

Check open SRC BEB20010s and confirm a PMH number has been returned from RETAIN. This

return may take a while.

Notes: 63.xx 以上微码,Call Home 是以机柜为单位进行的,因此务必要对每个机柜都进

行测试。

5. 配置 HMC 的 RSF,允许外部拨入(Customize Inbound Connectivity)

1) 将电话线插入 HMC 背面内置 Modem 卡的“LINE”端口

2) 打开 Remote Support,选择“Customize Inbound Connectivity”

3) 如果是使用 Modem,就勾选”Allow unattended session”,并且填入该电话线的号码,例

如 8620-38888888,点击 OK 完成。(建议重启一次 HMC 让配置生效)

53

Page 54: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

54

4) 如果是使用客户机房的宽带(VPN方式),就必须在“Attended Session”栏下点击“Prepare”

按钮,打开 VPN 连接窗口。

5) 点击“Start”建立 VPN 连接。注意观察进度,大约 5 至 10 分钟之后,出现“Connection

opened successfully”,表明 VPN 连接已经成功。(注意该窗口在 VPN 连接过程中不能被

关闭,否则 VPN 连接会中断)

Page 55: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

电话线和 VPN 拨入方式比较:

电话线方式:

配置相对比较简单,外界随时可以拨入;但是连接速度较慢,在首次配置或插拔电话线之

后,需要重启 HMC 才能生效

VPN 拨入方式:

连接速度快一点;每次建立连接,在没有拨入的情况下只能持续很短的一段时间,然后就

会自动中断。另外每次 VPN 拨入,都需要 SSR 到客户现场,在 HMC 上手工建立 VPN 连

接。

此外,对于新装机,必须在首次配置好 VPN Call Home 之后,生成一个 HMC Public Key

并通过 Call Home 传回 IBM 的 VPN 服务器,之后才能实现 VPN 拨入。生成方法见下文

6. 在 HMC 上生成 Public Key 并通过 Call Home 传回 IBM

1) 在 Service Focal Point 的 Service Utilities 里面,选择“Get HMCs”

2) 窗口打开之后,选择相应的 Local HMC

3) 在“Selected”菜单中选择“Generate HMC Public Key…”

55

Page 56: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

56

4) 弹出的确认窗口将提示接下来要生成一对 public key(for WebSM)和 private key(for

HMC 自己)。选择 Yes 确定生成 Key。

等待约 1 分钟

5) 出现提示,表明 public key 已经成功生成,点 OK 继续

6) 打开 Service Focal Point,查看 Open Serviceable Events,会看到一个 SRC 为“BEF00010”

的 Event,就是生成 HMC Public Key 所产生的

Page 57: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

57

7) 把滚动条往右边拉,可以看到该 event 的内容。意思是已经为 WebSM 生成了 Public Key,

这是一个提示性的 Event,应该被关闭。

8) 人手将该 Event 关闭。与此同时,HMC 的 Key 会通过 Call Home 自动回传 IBM 的 VPN

服务器

十九、如何配置CALL HOME和HMC的RSF(微码 64.xx或以上版本)

Notes:配置 Call Home 前,必须提前一天将 DS8000 的主柜、扩展柜型号、序列号,以及

机器的装机日期,通知相关人员把 相关序列号在 RETAIN 系统中注册,方能实现 Call

Home,并生成 PMH。

SSR 可以在 RETAIN 里面参照以下步骤来确认某个机柜是否已经注册:

登录 RETAIN, 输入命令“n;z/cpu NNNNSSSSSSS”

NNNN 是机柜的 M/T,例如 2107,2421,2422,2423,2424

SSSSSS 是机柜的 6 位序列号,例如 75SN888(注意每个扩展柜有自己的序列号)。

如果可以搜到这个机柜,那么就表明这个机柜已经被注册。

如果返回“UNKNOWN CPU SPECIFIED”,那么就表明这个机柜还没有在 RETAIN 里面注

册。

Page 58: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

58

选择 1,查看注册的具体记录,Status 的位置必须是数值“2”、“9”或者“1”。

1. 打开 Service Management,选择“Manage Customer Information”(在配置 CALL HOME

之前,这一步必须先完成)

Page 59: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

59

2. 只需要填写“Administrator”页,“System”页和“Account”页不需要填写。带*号的

地方一定要填写

3. 配置 CALL HOME(Manage Outbound Connectivity)

1) 打开 Connectivity,选择“Manage Outbound Connectivity”

2) 选择“Local Console Configuration”

Page 60: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

60

3) 勾选“Enable Local System as Call Home Server”

4) 如果是使用 Modem 电话线 Call Home,就打开“Local Modem”页,勾选“Allow dialing

using the local modem”,从列表中选择系统提供的电话号码。也可以尝试手工输入另外

2 个 电 话 号 码 : 16970 ( 中 国 北 方 ) 和 400-6744444 ( 中 国 南 方 ) 。

Page 61: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

最后点击“OK”完成,关闭窗口

5) 如果该电话线是分机,则点击“Modem Configuration…”,打开“Modem Setting”页,

在“Dial Prefix”填写拨号前缀,例如 9 或 0。如果打外线是直拨就不需要执行这一

61

Page 62: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

6) 如果是使用 VPN Call Home,就打开“Internet VPN”页,勾选“Allow a VPN using an

existing Internet connection”

7) 可以点击“Test”进行VPN连接测试 (该Test只是测试连通性,不会产生Call Home PMH)

8) 点击“Start”开始测试,直到出现“Test Completed Successfully”,表明连接性测试成功

4. Call Home 生成 PMH 测试

注意:启用 Call Home 的机器,务必进行该测试,该测试通过,方能证明所有设置正确!

a. From the navigation area, click Storage Facility Management.

b. From the right work area, select the check box for the appropriate storage facility. The bottom

Task area displays a list of tasks you can select.

c. From the bottom Task area, click Service Utilities > Test Problem Notification (PMH, SNMP,

Email). The Test Problem Notification (PMH, SNMP, Email) window opens and lists the

storage facility and its expansion racks, if any.

62

Page 63: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

d. Perform the test on each of the listed racks:

i. Select the first rack in the list and click Test Callhome.

ii. When you are prompted to generate a serviceable event with reference code

BEB20010, click Yes.

iii. When the message TestPMR Successful is displayed, make note of the rack serial

number and problem ID, then click OK.

iv. Repeat the test for the remaining racks.

v. Check open SRC BEB20010s and confirm a PMH number has been returned from

RETAIN. This return may take a while.

(Select Service Management > Manage Serviceable Events)

注意: 一定要对每个机柜,包括所有的扩展柜都进行测试。

5. 配置 HMC 的 RSF,允许外部拨入(Manage Inbound Connectivity)

1) 将电话线插入 HMC 背面内置 Modem 卡的“LINE”端口

2) 打开 Connectivity,选择“Manage Inbound Connectivity”

3) 如果是使用 Modem,就勾选”Allow unattended session”,并且填入该电话线的号码,例

如 8628-61111111,点击 OK 完成。(建议重启一次 HMC 让配置生效)

63

Page 64: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

4) 如果是使用客户机房的宽带(VPN方式),就必须在“Attended Session”栏下点击“Prepare”

按钮,打开 VPN 连接窗口。

5) 点击“Start”建立 VPN 连接。注意观察进度,大约 5 至 10 分钟之后,出现“Connection

opened successfully”,表明 VPN 连接已经成功。(注意该窗口在 VPN 连接过程中不能被

关闭,否则 VPN 连接会中断)

64

Page 65: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

二十、如何备份HMC的Critical Console Data(微码 63.xx或以下版本)

HMC 的 Critical Console Data 备份非常重要,因为在没有备份的情况下恢复 HMC 的 PC

硬盘,修复起来会比较复杂。

一般建议 Critical Console Data 的备份,在升级 HMC 微码的前后各做一次。请妥善保管这

张备份 DVD。DS8000 从一开始就配了 2 张 DVD 。2006 年 6 月后出厂的 8000,有一张 DVD

已经在出厂前刻好了相应 HMC 的序列号,是备份 critical console data 专用的 DVD。另外一

张是用作收集 PEPKG 和 Statesave 信息的。默认的备份策略是 7 天一次。

以下介绍一下手动备份的操作方法:

1. 打开 Licensed Internal Code Maintenance 下面的 HMC Code Upgrade

2. 点击 Backup Critical Console Data

3. 默认选项是“Back up to DVD on local system”,维持默认选项不变,将 DVD-RAM 放

入 HMC,点击“Next”

4. 备份将持续 2 至 3 个小时左右。

65

Page 66: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

二十一、如何备份HMC的Critical Console Data(微码 64.xx或以上版本)

64.xx 或以上微码版本的 DS8000,HMC 的 Critical Console Data 是备份到 570 控制器的内

置硬盘上的,不需要再使用 HMC 的 DVD 驱动器了。

手动备份的操作方法如下:

1. 打开 HMC Management 下面的 Backup Critical Data

2. 备份时间较以前 DVD 方式快了很多。

二十二、如何关闭DS8000 基本柜控制面板上的黄色故障灯(微码 63.xx或以下版本)

理论上故障灯会在发现 OPEN Service Event 之后亮起,在所有 Service Event 被关闭之后熄

灭。但是某些情况下,故障灯在所有 Service Event 被关闭之后仍然不熄灭,这是可以通过

HMC 关闭故障灯。

1. 首先在 Service Focal Point 的 Manage Serviceable Events 里面,确认没有任何 OPEN 的

66

Page 67: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

Event 了:

2. 在 Service Focal Point 的 Service Utilities 里面,选择相应的“Storage Facility”

3. 在“Selected” 菜单中选择“View/Reset Attention Indicators”

4. 可以看到当前的 Attention LED 处于“on”状态,点“Turn Off All Attention LEDs”按钮

67

Page 68: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

5. 提示确认是否关闭故障灯,点 Yes 确定

6. 提示故障灯已经成功关闭,此时面板上的故障灯已经熄灭,点 OK 确定

二十三、如何关闭DS8000 基本柜控制面板上的黄色故障灯(微码 64.xx或以上版本)

理论上故障灯会在发现 OPEN Service Event 之后亮起,在所有 Service Event 被关闭之后熄

灭。但是某些情况下,故障灯在所有 Service Event 被关闭之后仍然不熄灭,这是可以通过

HMC 关闭故障灯。

1. 首先在 Service Focal Point 的 Manage Serviceable Events 里面,确认没有任何 OPEN 的

Event 了:

2. 打开 Storage Facility Management,选择相应的 Storage Facility,在 Service Utilities 菜单

下选择“View/Reset Attention Indicators”

68

Page 69: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

69

3. 可以看到当前的 Attention LED 处于“on”状态,点“Turn Off All Attention LEDs”按钮

4. 提示确认是否关闭故障灯,点 Yes 确定

Page 70: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

二十四、如何将DS8000 关闭和加电(微码 63.xx或以下版本)

关机步骤:

正确的关机步骤首先应参考 Infocenter 的 MAP2470,以下步骤仅供参考

1. 首先到机器的后面,确认 Local/Remote 开关处于正常的“Remote”(向上)位置。如果

不是,则拨到 Remote 位置。

2. 在 Service Focal Point 的 Service Utilities 里面,选择相应的“Storage Facility”

3. 在“Selected” 菜单中选择“Manage Power Control…”

4. 在弹出的窗口中,首先确认当前的 Power Control Mode 是“Manual”,然后确认“Current

State”是“On”,然后选中 Power OFF Storage Facility,点按钮 Apply

注意:1)关机将持续 5 至 10 分钟,直到所有硬盘的灯熄灭为止

2) 除非地震或火灾等紧急情况,否则千万不要通过红色的 UEPO 开关来关机,会

导致数据丢失!!!

3)如果需要完全下电,先从 HMC 菜单关闭 HMC

a. From the task bar, click Console.

b. Select Exit and then click Exit Now.

c. From the selection box, select Shutdown.

d. Click OK.

e. Wait until the management console powers off. The power LED on the front of the

management console will be slow blinking.

最后打下 PPS 后面的黄色空气开关(拨到“OFF”位置)

注意: 如果机器是彻底下电,请将所有 PPS 上的供电电源线拔掉!如果在关机过程中遇

到任何问题,请立即开 PMH 申请技术支持。如果机器在关机过程中,因硬件问题,可能

会导致数据不能完全写到硬盘上,不正确的操作将会导致客户数据丢失!!

4)在整个关机和加电过程中,都不应该去触动 P570 的控制面板的白色电源开关。

70

Page 71: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

71

开机步骤:

1. 先打开主柜的所有 PPS(每个柜子两个)后面的黄色空气开关(拨到“ON”位置),并

检查 UEPO 是否打开,若关闭,请打开,给主柜上电。等待 2 分钟左右,直到两个 PPS

加电完毕之后

2. 打开扩展柜的所有 PPS(每个柜子两个)后面的黄色空气开关(拨到“ON”位置),并

检查 UEPO 是否打开,若关闭,请打开,给主柜上电。等待 2 分钟左右,直到两个 PPS

加电完毕之后

3. 启动 HMC

4. 重复关机步骤 1 和 2, 在弹出的窗口中,首先确认当前的状态“Current State”是“Off”,

然后选中 Power ON Storage Facility,点按钮 Apply

5. 开机过程将持续 40 分钟左右。

6. 判断开机完毕的依据:

运行“View Storage Facility State/End-of-Call”,确认一切正常。

Page 72: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

二十五、如何将DS8000 关闭和加电(微码 64.xx或以上版本)

关机步骤:

正确的关机步骤首先应参考 Infocenter 的 MAP2470,以下步骤仅供参考

1. 首先到机器的后面,确认 Local/Remote 开关处于正常的“Remote”(向上)位置。如果

不是,则拨到 Remote 位置。

2. 打开 Storage Facility Management,选择相应的 Storage Facility

3. 在“Service Utilities” 菜单中选择“Storage Facility Power Control…”

4. 在弹出的窗口中,首先确认当前的 Power Control Mode 是“Manual”,然后确认

“Current State”是“On”,然后选中 Power OFF Storage Facility,点按钮 Apply

注意:1)关机将持续 5 至 10 分钟,直到所有硬盘的灯熄灭为止

2) 除非火灾或地震等紧急情况,否则千万不要通过红色的 UEPO 开关来关机,会

导致数据丢失!!!

3)如果需要完全下电,先从 HMC 菜单关闭 HMC

From the navigation area, click HMC Management.

In the right work area, go to the Operations section and click Shut Down or Restart.

The Shutdown or Restart window opens.

Select Shutdown HMC.最后打下 PPS 后面的黄色空气开关(拨到“OFF”位置)

Notes: 如果机器是彻底下电,请将 PPS 上的供电电源线拔掉!如果在关机过程中遇到任

何问题,请立即开 PMH 申请技术支持。如果机器在关机过程中,因硬件问题,可能会导

致数据不能完全写到硬盘上,不正确的操作将会导致客户数据丢失!!

4)在整个关机和加电过程中,都不应该去触动 P570 的控制面板的白色电源开关。

72

Page 73: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

73

开机步骤:

1. 先打开主柜的所有 PPS(每个柜子两个)后面的黄色空气开关(拨到“ON”位置),并

检查 UEPO 是否打开,若关闭,请打开,给主柜上电。等待 2 分钟左右,直到两个 PPS

加电完毕之后

2. 打开扩展柜的所有 PPS(每个柜子两个)后面的黄色空气开关(拨到“ON”位置),并

检查 UEPO 是否打开,若关闭,请打开,给主柜上电。等待 2 分钟左右,直到两个 PPS

加电完毕之后

3. 启动 HMC

4. 重复关机步骤 1 和 2, 在弹出的窗口中,首先确认当前的状态“Current State”是“Off”,

然后选中 Power ON Storage Facility,点按钮 Apply

5. 开机过程将持续 40 分钟左右。

6. 判断开机完毕的依据:运行“View Storage Facility State/End-of-Call”,确认一切正常。

二十六、如何查看DDM的微码(微码 63.xx或以下版本)

1. 打开Licensed Internal Code Maintenance下面的Change Internal Code,选择相应的Storage

Facility,选择“DDM Utilities…”

2. 选择的相应的 SFI,点 Okay

Page 74: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

74

3. 选择“Display DDM Code Levels”

4. 弹出的窗口将列出所有 DDM 的微码版本和相应的位置号:

5. 此外还有 CEC DDM 和 FCIC 卡的微码版本信息:

Page 75: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

75

二十七、如何查看DDM的微码(微码 64.xx或以上版本)

1. 打开 Updates 菜单

2. 选择的相应的 Storage Facility

3. 选择“Recovery Utilities…”

4. 选择“DDM Utilities”

5. 选择“Display DDM Code Levels”

Page 76: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

6. 弹出的窗口将列出所有 DDM 的微码版本和相应的位置号:

7. 此外还有 CEC DDM 和 FCIC 卡的微码版本信息:

76

Page 77: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

77

Page 78: IBM DS8000 快速维护手册 - sgoldin.com · IBM DS8000 快速维护手册 ... 十五、如何收集State Save和AIX Dump(微码63.xx ... 所以工程师在巡检. DS8000

二十八、如何退出及关闭HMC(微码 64.xx或以上版本)

1. Logoff HMC

在操作界面右上角,有 Logoff 图样,在完成操作后,需要点击 Logoff 以退出登录

2. Shutodwn 或者重启 HMC

微码在 64.xx 或以上的 DS8000,HMC 关机或重启的方式和 63.xx 或以下微码的不一样,必

须要在选 HMC Management 菜单里面单独选择 Shut Down or Restart。

3. 可以选择 Shutdown HMC 或者 Restart HMC

78