28
IBM面向认知时代 的软件定义系统平台设计 和媒体行业实践 刘鑫,[email protected]

IBM面向认知时代 的软件定义系统平台设计 和媒体行业实践 · 2016-12-16 · Media Cloud连甠ESS勤畭带文件 痉痯一起搭建自剳分层存储痉痯( PB+),对其客户提供卨体存储云

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: IBM面向认知时代 的软件定义系统平台设计 和媒体行业实践 · 2016-12-16 · Media Cloud连甠ESS勤畭带文件 痉痯一起搭建自剳分层存储痉痯( PB+),对其客户提供卨体存储云

IBM面向认知时代的软件定义系统平台设计和媒体行业实践

刘鑫,[email protected]

Page 2: IBM面向认知时代 的软件定义系统平台设计 和媒体行业实践 · 2016-12-16 · Media Cloud连甠ESS勤畭带文件 痉痯一起搭建自剳分层存储痉痯( PB+),对其客户提供卨体存储云

| 2© 2016 IBM Corporation IBM / NDA 机密

程序计算

基于预先设定的参数来分析数据,进行决策• 确定性的应用• 定向的搜索• 机器语言• 直接结果

认知计算

从自身与数据、与人的持续交互中学习,通过概率性推理来不断提高自我• 概率性的应用• 定向的探索• 自然语言• 智能选项

Page 3: IBM面向认知时代 的软件定义系统平台设计 和媒体行业实践 · 2016-12-16 · Media Cloud连甠ESS勤畭带文件 痉痯一起搭建自剳分层存储痉痯( PB+),对其客户提供卨体存储云

IBM Systems | 3

机器学习领域挤满了初创企业

Page 4: IBM面向认知时代 的软件定义系统平台设计 和媒体行业实践 · 2016-12-16 · Media Cloud连甠ESS勤畭带文件 痉痯一起搭建自剳分层存储痉痯( PB+),对其客户提供卨体存储云

| 4© 2016 IBM Corporation IBM / NDA 机密

http://v.youku.com/v_show/id_XMTc4MTczODU2OA==.html

?from=s1.8-1-1.2&spm=a2h0k.8191407.0.0

Page 5: IBM面向认知时代 的软件定义系统平台设计 和媒体行业实践 · 2016-12-16 · Media Cloud连甠ESS勤畭带文件 痉痯一起搭建自剳分层存储痉痯( PB+),对其客户提供卨体存储云

| 5© 2016 IBM Corporation IBM / NDA 机密

广电行业的认知商业模式

内容生产不同用户群体的内容诉求是什么?

市场营销是否精准瞄准了合

适的用户

分发通过什么平台进行

内容分发

货币化我的内容价值几何

用户体验用户在说什么

Page 6: IBM面向认知时代 的软件定义系统平台设计 和媒体行业实践 · 2016-12-16 · Media Cloud连甠ESS勤畭带文件 痉痯一起搭建自剳分层存储痉痯( PB+),对其客户提供卨体存储云

| 6© 2016 IBM Corporation IBM / NDA 机密

强大的基础架构平台提升认知能力

1. 理解自然语言及人类会话,会听,会读,会看

3. 从用户的选择和反应中调整及学习

2. 为生成更好的结果产生并评估假设

认知能力

认知基础平台 强大的硬件加速

高效的资源调配

海量的扩展和容错能力

容器技术 4K/8K/VR混合云

GPU

数以万计的磁盘FPGA ASIC跨域多活

Page 7: IBM面向认知时代 的软件定义系统平台设计 和媒体行业实践 · 2016-12-16 · Media Cloud连甠ESS勤畭带文件 痉痯一起搭建自剳分层存储痉痯( PB+),对其客户提供卨体存储云

IBM Systems | 7

IBM为认知优化的软件定义存储与计算平台参考架构

IBM Spectrum Cluster Foundation Open Stack/xCAT

IBM Spectrum Scale

基础架构管理云管理

数据存储和管理

技术支持和服务

IBM Spectrum Computing Resource Management & Orchestration (EGO)

IBM Spectrum Symphony

IBM Spectrum Symphony

(MapReduce)

IBM Spectrum LSF/MPI

Hadoop /Big Data 高性能计算(批处理,并行,MPI,工作流)

容器云(微服务的管理)

资源管理

负载引擎

Linux on zx86PowerDiskTape

私有云、公有云、混合云架构 (异构的分布式计算和存储环境)

FlashSystem VMDocker

Spark(企业级解决方案)

高性能分析(低延迟并行)

IBM Spectrum Conductor

IBM Spectrum Conductorwith Spark

Page 8: IBM面向认知时代 的软件定义系统平台设计 和媒体行业实践 · 2016-12-16 · Media Cloud连甠ESS勤畭带文件 痉痯一起搭建自剳分层存储痉痯( PB+),对其客户提供卨体存储云

IBM Systems | 8

让数据触手可及的统一媒体数据共享管理平台

IBM Confidential

NFS

Hadoop Transparency

OpenStack

POSIX

内容采集/编辑/播出

认知计算集群

On-Premise海量对象存储

SMBCinder Swift

GlanceManila

VMware

SRMVADPVAAI vSphere

统一命名空间

IBM Spectrum Scale统一媒体数据共享管理平台

分布式集群

Site A

Site B

Site C

GPFS AFM

远程访问私有云、混合云和公有云

外部云访问

高性能全闪存阵列

x86

中低速大容量磁盘阵列 磁带库

MAM媒资应用

合适的数据、合适的位置、合适的时间、合适的性能、合适的成本

Page 9: IBM面向认知时代 的软件定义系统平台设计 和媒体行业实践 · 2016-12-16 · Media Cloud连甠ESS勤畭带文件 痉痯一起搭建自剳分层存储痉痯( PB+),对其客户提供卨体存储云

IBM Systems | 9IBM Systems

IBM Spectrum Scale价值

规模性存储管理

• 9000+节点

• 400GB/s+吞吐量

• 十亿+文件

• 新的GUI及健康监控

• 统一文件,对象以及HDFS支持

• 分布式元数据

• 元数据高速扫描(每节点每分钟一千万文件)

• QoS管理

• 通过Spectrum Control集中管理多集群

Store everywhere. Run anywhere.

• 迟延感知的高级路径选择

• 读写缓存化

• 为WAN部署的活动文件管理(Active File Management)

• 文件布局优化

• 端到端数据完整性检验

• 快照

• 同步或异步数据复制

改善数据经济

• 无缝数据分层管理

• 纳入并共享flash资

• 策略驱动的数据压缩

• 以擦除码及复制功能提供的数据保护

• 本地加密 &安全擦除符合性校验

• 对象存储及云支持

• 备份及恢复

软件定义的开放平台

• 支持异构存储,不论flash, disk 或tape结构

• Native支持NFS/CIFS

• 以软件,应用机或云载体提供数据驱动移动OpenStack SWIFT & S3文件及对象接口

• 对HDFS的透明化

• 与云的集成

| 9

Page 10: IBM面向认知时代 的软件定义系统平台设计 和媒体行业实践 · 2016-12-16 · Media Cloud连甠ESS勤畭带文件 痉痯一起搭建自剳分层存储痉痯( PB+),对其客户提供卨体存储云

IBM Systems | 10

� � �>

�.. �.. ...

Spectrum Scale – 利用策略实现自动化媒体资源分层管理

/home/appl/data/web/important_big_spreadsheet.xls

/home/appl/data/web/big_architecture_drawing.ppt

/home/appl/data/web/unstructured_big_video.mpg

/home

/appl

/data

/web

/home/appl/data/web/important_big_spreadsheet.xls

/home/appl/data/web/big_architecture_drawing.ppt

/home/appl/data/web/unstructured_big_video.mpg

GPFS Policy

GPFS统一命名空间

Pool 1: Flash/SSD Pool 2: 高端磁高端磁高端磁高端磁盘阵列列列列 Pool 3: 低端存低端存低端存低端存储/本地磁本地磁本地磁本地磁盘

GPFS Nodes

GPFS Nodes

GPFS Nodes

Storage Controllers

Storage Controllers >

Storage Controllers

外部资源池

Page 11: IBM面向认知时代 的软件定义系统平台设计 和媒体行业实践 · 2016-12-16 · Media Cloud连甠ESS勤畭带文件 痉痯一起搭建自剳分层存储痉痯( PB+),对其客户提供卨体存储云

IBM Systems | 11

� � �>

�.. �.. ...

/home/appl/data/web/important_big_spreadsheet.xls

/home/appl/data/web/big_architecture_drawing.ppt

/home/appl/data/web/unstructured_big_video.mpg

/home

/appl

/data

/web

GPFS Policy

GPFS统一命名空间

Pool 1: Flash/SSD Pool 2: 高端磁高端磁高端磁高端磁盘阵列列列列 Pool 3: 低端存低端存低端存低端存储/本地磁本地磁本地磁本地磁盘

GPFS Nodes

GPFS Nodes

GPFS Nodes

Storage Controllers

Storage Controllers >

Storage Controllers

/home/appl/data/web/important_big_spreadsheet.xls

/home/appl/data/web/big_architecture_drawing.ppt

/home/appl/data/web/unstructured_big_video.mpg

外部资源池

Spectrum Scale – 利用策略实现自动化媒体资源分层管理

Page 12: IBM面向认知时代 的软件定义系统平台设计 和媒体行业实践 · 2016-12-16 · Media Cloud连甠ESS勤畭带文件 痉痯一起搭建自剳分层存储痉痯( PB+),对其客户提供卨体存储云

IBM Systems | 12

闪存时代已经到来…Flash与传统磁盘的成本已经接近

预计到2017年, 基于TLC/3D nano的闪存单位成本将低于高速SAS硬盘

GartnerGartnerGartnerGartner关于全闪存市场的预测关于全闪存市场的预测关于全闪存市场的预测关于全闪存市场的预测::::

““““到到到到2020202020202020年年年年,,,,25252525%%%%的数据中心将在的数据中心将在的数据中心将在的数据中心将在Tier1Tier1Tier1Tier1主数据主数据主数据主数据

上上上上只只只只使用全闪存存储使用全闪存存储使用全闪存存储使用全闪存存储,,,,而不是混合存储方式而不是混合存储方式而不是混合存储方式而不是混合存储方式,,,,这一比这一比这一比这一比

例今天尚不足例今天尚不足例今天尚不足例今天尚不足1%”;1%”;1%”;1%”;

购买的存储朝着闪存和大容量磁盘两极分化

来源:IDC 2014-2018 年全球和美国企业存储系统预测,IDC 存储用户需求研究,2014 年秋季发布

Page 13: IBM面向认知时代 的软件定义系统平台设计 和媒体行业实践 · 2016-12-16 · Media Cloud连甠ESS勤畭带文件 痉痯一起搭建自剳分层存储痉痯( PB+),对其客户提供卨体存储云

IBM Systems | 13IBM IBM IBM IBM Systems

|

IBM全闪存产品家族

FlashSystem V9000

FlashSystem 900

V5000F

V7000F

性能性能性能性能 $/IO$/IO$/IO$/IO

(低延迟)

扩展性扩展性扩展性扩展性 $/PB$/PB$/PB$/PB

(高密度)

价价价价值值值值 $/TB$/TB$/TB$/TB

(成本/ 性能)

应用范例应用范例应用范例应用范例

媒体娱乐

混合云

分层/混合数据中心负

应用加速

FlashSystem

900 with CAPI

定制化定制化定制化定制化闪存系存系存系存系统

内存数据库扩

展与加速

DS8888 “All-Flash”

微延微延微延微延迟与与与与FlashCoreFlashCoreFlashCoreFlashCore

FlashSystem

A9000/R

中小型数据中心环

境数据简化移植与

应用

DeepFlash 150

非结构化数据特性非结构化数据特性非结构化数据特性非结构化数据特性

PB级的扩充规模 通常不能从数据缩减功能中获益或可数据缩

减潜力有限

读密集,吞吐量大

大数据

Page 14: IBM面向认知时代 的软件定义系统平台设计 和媒体行业实践 · 2016-12-16 · Media Cloud连甠ESS勤畭带文件 痉痯一起搭建自剳分层存储痉痯( PB+),对其客户提供卨体存储云

IBM Systems | 14IBM IBM IBM IBM Systems

|

大容量,高IO吞吐率•高达25GB/s的IO吞吐率•1.5PB的可用磁盘容量(具体视RAID方式而定)

强大的容错能力•来自于美国劳伦斯利弗莫尔国家实验室,10000+磁盘高压力生产环境考验•内置世界领先的分布式RAID技术,大幅减少磁盘重建所需时间•可以实现2路或3路的容错方案•端对端的检错功能,完全避免磁盘“突然死亡”•丰富而完善的异步磁盘与系统诊断功能

Media Cloud采用ESS和磁带文件系统一起搭建自动分层存储系统(PB+),对其客户提供媒体存储云服务Media Storage as a Service,提供的服务包括剪辑、转录、编解码、前后期处理等

基于Spectrum Scale的新一代创新性存储阵列ESS

Page 15: IBM面向认知时代 的软件定义系统平台设计 和媒体行业实践 · 2016-12-16 · Media Cloud连甠ESS勤畭带文件 痉痯一起搭建自剳分层存储痉痯( PB+),对其客户提供卨体存储云

© 2016 IBM Corporation

IBM Cleversafe,对象存储领域的王者

The Industry Leader – 行业领导者• 从2014年至今,对象存储的领导者 –IDC• 对象存储总体领导者 – 2016 – Gartner

The Scale Leader – 规模领导者• 业界超过100PB级别用户最多的供应商• 客户遍及美国、欧洲、亚太地区

The Technology Innovation Leader – 技术创新领导者• 完全软件定义 – 超过400项专利• 运行在业界标准的x86服务器硬件上,可对磁盘进行底层管理和监控• 无与伦比的性价比、可靠性和安全性

Cleversafe成立于2004年,2015年被IBM收购

Page 16: IBM面向认知时代 的软件定义系统平台设计 和媒体行业实践 · 2016-12-16 · Media Cloud连甠ESS勤畭带文件 痉痯一起搭建自剳分层存储痉痯( PB+),对其客户提供卨体存储云

IBM Systems | 1616Page© 2016 IBM Corporation

原始数据

写入数据至 Cleversafe

通过 S3 兼容 API 或 Openstack Swift 兼容 API 将对象发送至Accesser

通过 S3 兼容 API 或 Openstack Swift 兼容 API 将对象发送至Accesser

1$Accesser

Page 17: IBM面向认知时代 的软件定义系统平台设计 和媒体行业实践 · 2016-12-16 · Media Cloud连甠ESS勤畭带文件 痉痯一起搭建自剳分层存储痉痯( PB+),对其客户提供卨体存储云

IBM Systems | 1717Page© 2016 IBM Corporation

原始数据

让我们存储一张图片!让我们存储一张图片!$

Accesser

写入数据至 Cleversafe

Page 18: IBM面向认知时代 的软件定义系统平台设计 和媒体行业实践 · 2016-12-16 · Media Cloud连甠ESS勤畭带文件 痉痯一起搭建自剳分层存储痉痯( PB+),对其客户提供卨体存储云

IBM Systems | 1818Page© 2016 IBM Corporation

每个对象将被分割为片段(Segment)。每个对象将被分割为片段(Segment)。2$

写入数据至 Cleversafe

Page 19: IBM面向认知时代 的软件定义系统平台设计 和媒体行业实践 · 2016-12-16 · Media Cloud连甠ESS勤畭带文件 痉痯一起搭建自剳分层存储痉痯( PB+),对其客户提供卨体存储云

IBM Systems | 1919Page© 2016 IBM Corporation

每个片段都被加密,随后切片(Slice)。(注意:加密为可选项)

每个片段都被加密,随后切片(Slice)。(注意:加密为可选项)

3$

76543

12

写入数据至 Cleversafe

Page 20: IBM面向认知时代 的软件定义系统平台设计 和媒体行业实践 · 2016-12-16 · Media Cloud连甠ESS勤畭带文件 痉痯一起搭建自剳分层存储痉痯( PB+),对其客户提供卨体存储云

IBM Systems | 2020Page© 2016 IBM Corporation

$

76543

12

纠删码用于将数据转换为可定制数量的切片。

纠删码用于将数据转换为可定制数量的切片。

4

1211109876543

12

写入数据至 Cleversafe

Page 21: IBM面向认知时代 的软件定义系统平台设计 和媒体行业实践 · 2016-12-16 · Media Cloud连甠ESS勤畭带文件 痉痯一起搭建自剳分层存储痉痯( PB+),对其客户提供卨体存储云

IBM Systems | 2121Page© 2016 IBM Corporation

$

76543

12

1211109876543

12

站点 1 站点 2 站点 3

存储节点 每个切片都被写入至单独的存储节点。在此示例中,存储节点位于地理上分散的 3 个站点。

每个切片都被写入至单独的存储节点。在此示例中,存储节点位于地理上分散的 3 个站点。

5

站点 2 站点 3

站点 3站点 1 站点 2

写入数据至 Cleversafe

Page 22: IBM面向认知时代 的软件定义系统平台设计 和媒体行业实践 · 2016-12-16 · Media Cloud连甠ESS勤畭带文件 痉痯一起搭建自剳分层存储痉痯( PB+),对其客户提供卨体存储云

IBM Systems | 2222Page© 2016 IBM Corporation

从 Cleversafe 读取数据

站点 1 站点 2 站点 3

存储节点

可借助 12 个切片中的任何 7 个执行读取操作• 写入时创建的切片数量称为宽度(此处为 12)• 读取时需要的切片数量称为读取阈值(此处为 7)• 该示例为“12 个”信息离散算法 (IDA) 中的 7 个

可借助 12 个切片中的任何 7 个执行读取操作• 写入时创建的切片数量称为宽度(此处为 12)• 读取时需要的切片数量称为读取阈值(此处为 7)• 该示例为“12 个”信息离散算法 (IDA) 中的 7 个

站点 2 站点 3

站点 3站点 1 站点 2

$

Page 23: IBM面向认知时代 的软件定义系统平台设计 和媒体行业实践 · 2016-12-16 · Media Cloud连甠ESS勤畭带文件 痉痯一起搭建自剳分层存储痉痯( PB+),对其客户提供卨体存储云

IBM Systems | 2323Page© 2016 IBM Corporation

站点 1 站点 2 站点 3

存储节点

可借助 12 个切片中的任何 7 个执行读取操作• 写入时创建的切片数量称为宽度(此处为 12)• 读取时需要的切片数量称为读取阈值(此处为 7)• 该示例为“12 个”信息离散算法 (IDA) 中的 7 个

可借助 12 个切片中的任何 7 个执行读取操作• 写入时创建的切片数量称为宽度(此处为 12)• 读取时需要的切片数量称为读取阈值(此处为 7)• 该示例为“12 个”信息离散算法 (IDA) 中的 7 个

站点 2 站点 3

站点 3站点 1 站点 2

$

在该 IDA 中,即使5个存储节点失效,数据仍可借助其他7个存储节点完成读取。

在该 IDA 中,即使5个存储节点失效,数据仍可借助其他7个存储节点完成读取。

从 Cleversafe 读取数据

Page 24: IBM面向认知时代 的软件定义系统平台设计 和媒体行业实践 · 2016-12-16 · Media Cloud连甠ESS勤畭带文件 痉痯一起搭建自剳分层存储痉痯( PB+),对其客户提供卨体存储云

IBM Systems | 2424Page© 2016 IBM Corporation

站点 1 站点 2 站点 3

存储节点

可借助 12 个切片中的任何 7 个执行读取操作• 写入时创建的切片数量称为宽度(此处为 12)• 读取时需要的切片数量称为读取阈值(此处为 7)• 该示例为“12 个”信息离散算法 (IDA) 中的 7 个

可借助 12 个切片中的任何 7 个执行读取操作• 写入时创建的切片数量称为宽度(此处为 12)• 读取时需要的切片数量称为读取阈值(此处为 7)• 该示例为“12 个”信息离散算法 (IDA) 中的 7 个

站点 2 站点 3

站点 3站点 1 站点 2

$

即使整个站点失效(外加另一个存储节点失效)也无影响。

� 分布式纠删码多站点多活架构

� 超过10年的客户验证

� 100 PB 以上数据量的客户最多

从 Cleversafe 读取数据

Page 25: IBM面向认知时代 的软件定义系统平台设计 和媒体行业实践 · 2016-12-16 · Media Cloud连甠ESS勤畭带文件 痉痯一起搭建自剳分层存储痉痯( PB+),对其客户提供卨体存储云

IBM Systems | 2525Page© 2016 IBM Corporation

如何为 1 PB 可用数据构建高度可靠的海量存储系统?

RAID 6 + 复制 Cleversafe®

1 PB3.6 PB

9003.6 倍3.6 倍3 FTE

复制/备份

可用存储原始存储

4TB 磁盘所需机架占地

运维人员其他软件

$$70% 以上

TCO 节省

原始1.20 PB 原始

现场镜像1.20 PB 原始

远程复制1.20 PB 原始

1 PB1.7 PB4321.7 倍1.7 倍.5 FTE无

Cleversafe平台实现了无与伦比的经济性、可靠性和安全性

Page 26: IBM面向认知时代 的软件定义系统平台设计 和媒体行业实践 · 2016-12-16 · Media Cloud连甠ESS勤畭带文件 痉痯一起搭建自剳分层存储痉痯( PB+),对其客户提供卨体存储云

IBM Systems | 2626Page© 2016 IBM Corporation

可用性 – 软件升级、硬件更新/搬迁、磁盘、节点和站点出现故障时无宕机时间。

安全性 – 单个磁盘、节点或站点不包含足以构成数据泄露的信息。

可扩展性 – 随时随地的扩展性能和/或容量,EB级别以上的海量数据管理能力

经济性 – 原始存储更少,由此可减少电力、制冷和占地成本,从而将 TCO 降至最低

可管理性 – 无需管理 RAID 集或复制方案。一名员工便可管理 数十PB的数据。

Cleversafe优势回顾

Page 27: IBM面向认知时代 的软件定义系统平台设计 和媒体行业实践 · 2016-12-16 · Media Cloud连甠ESS勤畭带文件 痉痯一起搭建自剳分层存储痉痯( PB+),对其客户提供卨体存储云

IBM Systems | 27

CDN

PGC/UGC/低码率新闻素材采集

分站P/U

客户端

分站P/U

客户端

区域中心

移动客户端

移动客户端

内容合作伙伴

客户端

互联网

上传

分站自动同步到总部传输服务器

分站自动同步到总部传输服务器

内容审核

编辑制作

内容发布

Page 28: IBM面向认知时代 的软件定义系统平台设计 和媒体行业实践 · 2016-12-16 · Media Cloud连甠ESS勤畭带文件 痉痯一起搭建自剳分层存储痉痯( PB+),对其客户提供卨体存储云

谢谢!

ibm.com/systems

IBM Systems