Upload
amena-hunt
View
149
Download
0
Embed Size (px)
DESCRIPTION
HPC 高性能计算. —— 保险行业解决方案. 议题. 精算业务 需求 及 现状 描述. HPC 介绍. 人保高性能平台案例分享. 客户工作模式. 客户工作模式 ——SAS. 源数据. 目标数据. 导入. 生成. 临时文件. SAS. 客户工作模式. 客户工作模式 ——Excel. 结果. 大 Excel 文件. 生成. 运行. VBA 脚本. 业务 需求及现状描述. SAS 和 Excel 的运算效率 现状 (参考人保): — 笔记本电脑,内存支持不到 4G 。 - PowerPoint PPT Presentation
Citation preview
HPC 高性能计算
—— 保险行业解决方案
议题
HPC 介绍
精算业务需求及现状描述
人保高性能平台案例分享
客户工作模式
Data
Data
Data
源数据
导入
目标数据
SAS
生成
临时文
件
客户工作模式—— SAS
客户工作模式客户工作模式—— Excel
运行
VBA脚本
生成大 Excel文件 结果
业务需求及现状描述• SAS 和 Excel 的运算效率 现状(参考人保):— 笔记本电脑,内存支持不到 4G 。— 系统 Windows XP 32bit ,运算常出现假死现象
• SAS 的存储要求 现状(参考人保):— 本机硬盘,容量小,易损坏。— 移动硬盘速度慢、易损坏、容量有限。— 历史信息及数据,没有统一集中管理,已经清理过的数据需要重复处理
业务需求及现状描述• 执行结果的准确性 现状(参考人保):— 源数据、中间数据、结果数据版本不一致,计算结果不准确。
• 机密文档的安全性 现状(参考人保):— 公司业务数据信息机密随笔记本、移动硬盘被带出公司。— 相对隔离的数据,没有很好的权限控制。
痛苦的结果• 模型计算:等了几个小时,岿然不动• 统计结果:经常重新再来• 磁盘空间:最痛恨被告知空间已满,无法计算• 数据备份:伤不起的 PC 机• 安全问题:问题依旧
终极目标
更高• 提升软硬件配置
更快• 提升员工工作效率
更强• 提升计算任务效率
更优• 优化团队协作效率
更佳• 提升管理执行力
议题
高性能计算介绍
精算业务需求及现状描述
人保高性能平台案例分享
高性能计算概述• 高性能计算 (HPC) 指通常使用很多处理器(作为单个机
器的一部分)或者某一集群中组织的几台计算机(作为单个计 算资源操作)的计算系统和环境。
• 领域专家或者工程师可以用来解决一些程序规模庞大、运算时间长以及数据量大的模型。
• 对计算任务进行分解,并把分解的任务块通过一定方式交给不同的处理器计算。
HPC 网络图
11
HPC 工作原理
12
将作业传给控制节点
初始化并分发任务
传递后台计算结果整合结果展现
HPC 应用及发展趋势• 高性能计算机能够广泛应用于生物、信息、电子商务、金
融、保险等产业,它同时也是传统产业(包括制造业)实现技术改造、提高生产率和竞争力的重要工具。高性能计算已从技术计算(即科学计算和工程计算)扩展到商业应用和网络信息服务领域。
• 高性能计算开始走出原来的科研计算向更为广阔的商业计算和信息化服务领域扩展。更多的典型应用在电子政务、石油物探、分子材料研究、金融服务、教育信息化和企业信息化中得以展现。
13
HPC国际成功案例• 美国能源部的加速战略计算计划,目标是构造 100万亿次的超级计算
机系统、软件和算法,在 2004年真实地模拟核爆炸。• 福特用高性能计算机构造了一个网上集市,通过网络连到它的 3万多
个供货商。这种网上采购不仅能降低价格,减少采购费用,还能缩短采购时间。福特估计这样做大约能节省 80亿美元的采购成本。
• 好利威尔公司和通用电气公司用网络将全球各地设计中心的服务器和贵重设备连于一体,以便于工程师和客户共同设计产品,设计时间可缩短 100倍
• 壳牌石油公司通过全球内部网和高性能服务器收集员工的创新建议,加以集中处理。其中产生了一种激光探测地下油床的新技术,为该公司发现了 3亿桶原油。
14
议题
高性能计算介绍
精算业务需求及现状描述
人保高性能平台案例分享
人保需求分析
大量的数据在单台 PC上运行。一个常规的计算,就要消耗大量时间,而且结果不定。性能
因为 SAS计算,在中间产生大量的中间临时文件。比如 10G 的数据,可能产生几个 50G 的临时文件,而最终所需的数据有可能只有 2-3G 。
存储问题
如果数据管理比较分散,或者数据源引用不一致,都可能造成几天的努力白费。数据管理
由于缺乏一个合规、流程化的工作环境,效率比较低。协同办公
解决方案
Windows HPC Server
• 端到端的完整解决方案• 可扩展的性能• 快速、可扩展的部署• 可扩展的管理、监控、故障排除和报表工
具• 具有业务关键性的基于面向服务的架构
( SOA )应用程序• 增强的 Excel 2010 的性能
18
Windows HPC Server
19
为什么要用 SharePointSharePoint 有完整的文档生命周期管理
创建 修订 / 审批 存储发布
日志记录
权限保护
模板
HPC + SharePoint
改变
• 模型计算:多节点服务器并行运行,节省大部分空间• 统计结果:数据源唯一,版本控制• 磁盘空间:服务器加存储• 数据备份:版本管理;服务器备份• 安全问题:灵活的权限管理
HPC + SharePoint
POC验证CPU数量
拟合计算次数40*CPU 32*CPU 24*CPU 16*CPU 8*CPU 1*CPU
1200 81 71 60 53 52 103
2400 84 76 66 62 74 205
4800 92 84 78 87 120 409
9600 106 105 109 130 208 817
19200 139 150 171 222 390 1636
38400 224 247 301 423 760 3217
76800 376 445 552 790 1511 6438
153600 699 830 1056 1554 3002 12876
307200 1317 1614 2071 3079 5977 25750
23
拟合计算并行测试结果
拟合次数规模
CPU数量拟合计算次数
40*CPU 32*CPU 24*CPU 16*CPU 8*CPU 1*CPU
307,200
5 个节点 4 个节点 3 个节点 2 个节点 1 个节点 1 个 CPU
1317 秒 1614 秒 2071 秒 3079 秒 5977 秒 25750 秒
0.37 小时 0.45 小时 0.58 小时 0.86 小时 1.66 小时 7.15 小时
部署架构
HPC拓扑结构
25
案例分享——硬件
26
案例分享— HPC 客户端
Excel计算
0
20
40
60 60
10
Excel 计算
单机 Linear ( 单机 )
多机
分钟
27
案例分享—延伸需求• 客户在数据审计过程中,利用
Excel 、 SAS 进行已决、未决数据的审计,计算速度和人工效率低下。
• SAS主要做数据钻取和统计,而关系型数据的管理却是 SQL Server 的强项。
• 客户希望在 SAS 和 Excel 中的数据管理和筛选任务转移到 SQL Server 中。
28
案例分享—延伸价值
29
案例分享—方案沉淀
SQL
源数据
SAS
整合数据
SAS 统计
HPC
报表服务商业智能
内容管理
。。。
搜索
HPC 管理
数据展现
功能驱动
项目管理
高性能价值
提高工作效率∆ 节省时间∆ 提升效率∆ 优化协作
简单易控的系统∆ 简化流程∆ 降低风险
∆ 服务满意度提升
管理工作的便利∆ 成本降低∆ 有效利用
对管理层对管理层
对 IT 管理人员对 IT 管理人员对业务员对业务员
Q&A
谢谢!