24
超超超超超超超超超超超超超超(ScMS) (ScMS) -- -- 超超超超超超超 超超超超超超超

超级计算管理系统 (ScMS)

Embed Size (px)

DESCRIPTION

超级计算管理系统 (ScMS). -- 需求和概要设计. 一、背景. 1. 超级计算在多个领域的应用. 地球物理. 流体力学. 气象生态学. 气象应用. ……. 空间科学. 化学工程. 2. 超级计算中心. 上海超级计算中心. NCSA ,美国国家计算机安全. Dell Intel? 64 Linux Cluster [abe] Peak performance: 89.47 TF (62.68 TF sustained) Top 500 list debut: #8 (June 2007). SGI Altix [cobalt] - PowerPoint PPT Presentation

Citation preview

Page 1: 超级计算管理系统  (ScMS)

超级计算管理系统 超级计算管理系统 (ScM(ScMS)S)

---- 需求和概要设计需求和概要设计

Page 2: 超级计算管理系统  (ScMS)

一、背景一、背景1. 超级计算在多个领域的应用

气象应用 流体力学 地球物理 气象生态学

空间科学 化学工程

……

Page 3: 超级计算管理系统  (ScMS)

2. 超级计算中心

曙光 4000A

系统峰值   10.2Tflops

计算结点   512 个 4 路 AMD Opteron 处理器

存储结点   16 个 4 路 AMD Opteron 处理器

接入结点   4 个 4 路 AMD Opteron 处理器

  CPU  AMD OPTERON 850, 2.4GHz ,

总共 2128 个 CPU

系统内存总容量   4256GB

磁盘总容量   20TB

体系架构   Cluster 、 Myrinet 2000

操作系统   Turbo Linux 8.0

上海超级计算中心

Page 4: 超级计算管理系统  (ScMS)

NCSA ,美国国家计算机安全

Dell Intel? 64 Linux Cluster [abe]Peak performance: 89.47 TF (62.68 TF sustained)Top 500 list debut: #8 (June 2007)

SGI Altix [cobalt]1,024 Intel Itanium 2 processorsPeak performance: 6.55 TF (6.1 TF sustained)Top 500 list debut: #48 (June 2005)

Page 5: 超级计算管理系统  (ScMS)

3. 使用方式

登录

并行编程

登录方式主要有三种:通过 rsh 、 ssh 和 telnet 等使用专门的客户端通过拨号的方式登录。

并行开发环境PVMMPIopenMP

Page 6: 超级计算管理系统  (ScMS)

4. 目前超级计算系统的缺点

从一个用户的角度讲,除了研究本专业领域之外,还需花费相当的时间来编制和调试并行程序从超级计算中心的角度来讲,需要为用户提供并行编程方面的培训。

组织角色

Page 7: 超级计算管理系统  (ScMS)

二、项目概要二、项目概要

Matlab用户

Matlab用户

Matlab用户

应用服务器

MPI集群

开发超级计算管理系统 (Supercomputing Managment System,SMS),目的是将用户从复杂的并行编程的工作中解放出来,同时削减超级计算中心在培训方面的投入。

Page 8: 超级计算管理系统  (ScMS)

MPI集群

提供矩阵运算服务

运算服务1.四则运算(加减乘除)2.求*,求逆,3.求特征向量4.FFT

MPI 集群提供各种矩阵运算服务,基本四则运算(加、减、乘、除),求 *, 求逆,求特征向量, FFT 等

Page 9: 超级计算管理系统  (ScMS)

应用服务器

1.用户认证2.计费3.计算任务管理

计算任务管理1.计算任务接收2.计算任务排队3.计算任务发送执行4.计算结果暂存5.计算结果返回

应用服务器负责用户认证、计费和计算任务管理

Page 10: 超级计算管理系统  (ScMS)

Matlab用户

Matlab用户登录应用服务器,提交计算任务

Matlab用户

Matlab软件超级计算管理系统

客户端

用户通过超级计算任务客户端登录到应用服务器。

然后用 Matlab 实现自己的运算,并创建计算任务,

将计算任务发送给超级计算管理系统客户端

Page 11: 超级计算管理系统  (ScMS)

三、功能需求三、功能需求1. 用户认证

用户发送用户名和密码

系统

对用户名和密码进行认证

Page 12: 超级计算管理系统  (ScMS)

2. 计费

系统 计时

计算时间:应用服务器将计算任务发给 MPI 集群开始计时,到应用服务器接收到计算结果,为止。

费用与计算时间成正比。

Page 13: 超级计算管理系统  (ScMS)

3. 计算任务管理

创建计算任务

提交计算任务

查询计算任务

撤销计算任务

用户

接受计算结果

接收计算任务

计算 系统

返回计算结果

Page 14: 超级计算管理系统  (ScMS)

4. 用户管理

添加用户

删除用户

系统

用户冲值

密码管理

用户

用户信息管理

Page 15: 超级计算管理系统  (ScMS)

四、非功能需求四、非功能需求

1. 安全性用户客户端与应用服务器的数据传输,须加密传输。如下所示:信息 ----〉加密 -----〉传输 -----〉解密 -----〉信息。

2.可扩展性方便系统功能的扩展。

Page 16: 超级计算管理系统  (ScMS)

五、系统平台和工具 五、系统平台和工具

Matlab 客户端

操作系统:windows xpMatlab : 7.0开发工具: vc++

应用服务器

操作系统平台: Unix/Linux开发语言: C/C++

Mpi 集群 --- 矩阵服务器

操作系统平台: Unix/Linux开发语言: C/C++

Page 17: 超级计算管理系统  (ScMS)

六 、数据库设计六 、数据库设计

字段名类型 长度 是否

NULL默认值 说明

Userid int 4 否 无Username Char 50 否 无Password char 50 否 无

表 Fee

字段名类型 长度 是否

NULL默认值 说明

Userid int 4 否 无Fee Long 8 否 0.00

Time_used time 否 0:00:00

2.表 Fee

1.表 login

Page 18: 超级计算管理系统  (ScMS)

字段名 类型 长度 是否 NULL

默认值 说明

Userid int 4 否 无Tel char 20 是 无Addree char 50 是 无ID char 18 是 无

3.表 user

Page 19: 超级计算管理系统  (ScMS)

七、安全数据传输七、安全数据传输 认证过程:认证过程:

客户端生成一对会话密钥,客户端生成一对会话密钥, 用认证公钥加密会话公钥、用户名和密码,用认证公钥加密会话公钥、用户名和密码,

并传给服务器,并传给服务器, 服务器用认证私钥解密,对用户名和密码进服务器用认证私钥解密,对用户名和密码进

行验证,如果通过验证,则开始会话。行验证,如果通过验证,则开始会话。

Page 20: 超级计算管理系统  (ScMS)

会话过程:会话过程: 客户端将计算任务用会话私钥加密,并传给客户端将计算任务用会话私钥加密,并传给

服务器。服务器。 服务器用会话公钥解密。服务器用会话公钥解密。

Page 21: 超级计算管理系统  (ScMS)

九、计算任务格式九、计算任务格式 矩阵计算格式采用矩阵计算格式采用 xmlxml文件格式:文件格式:<operator>operator</operator><operator>operator</operator><para-1><para-1>AA</para-1></para-1><para-2><para-2>BB</para-2></para-2>表示的运算是:表示的运算是: A operator BA operator B

Page 22: 超级计算管理系统  (ScMS)

举例:A*B<operator>*</operator><para-1>A</para-1><para-2>B</para-2>

Page 23: 超级计算管理系统  (ScMS)

批量任务(使用嵌套)批量任务(使用嵌套)<operator> operator </operator><operator> operator </operator> <para-1 type=1 row= col= ><para-1 type=1 row= col= > <operator> operator1</operator><operator> operator1</operator> <para- 1 type=0 row= col= ><para- 1 type=0 row= col= > A1A1 </para-1></para-1> <para-2 type=0 row= col= ><para-2 type=0 row= col= > A2A2 </para-2></para-2> </para-1></para-1> <para-2 type=0 row= col= return= ><para-2 type=0 row= col= return= > BB </para-2> </para-2>

表达式:表达式: (A1 operator1 A2) operator B(A1 operator1 A2) operator B

type : 0= 参数; 1= 表达式row: 矩阵行数col : 矩阵列数

Page 24: 超级计算管理系统  (ScMS)