51
大数据安全技术与防护体系 中国通信院安全所数据安全研究部 刘明辉 2019年07月 1

大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

  • Upload
    others

  • View
    18

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

大数据安全技术与防护体系

中国通信院安全所数据安全研究部

刘明辉

2019年07月

1

Page 2: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

cO N T E N T S

目 录

大数据安全的概念和内涵

三 大数据安全的主要挑战

大数据安全国家标准与行业标准现状四

五 大数据安全防护体系

2

一 背景

Page 3: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 3

背景 :国家对大数据安全提出新要求

3

2017年12月8日,习近平主席在中共中央政治局就实施国家大数据战

略第二次集体学习时指出,“要切实保障国家数据安全。要加强关键

信息基础设施安全保护,强化国家关键数据资源保护能力,增强数据

安全预警和溯源能力。要加大对技术专利、数字版权、数字内容产品

及个人隐私等的保护力度。要加强国际数据治理政策储备和治理规则

研究,提出中国方案。”

2019年1月25日,习近平主席在中共中央政治局就全媒体时代和媒体

融合发展举行第十二次集体学习时指出,要全面提升技术治网能力和

水平,规范数据资源利用,防范大数据等新技术带来的风险。

国家数字经济发展中安全保障意义重大

Page 4: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 4

背景 :数据泄露事件数量持续增长,造成的危害日趋严重

4

近几年金雅拓(Gemalto)发布的全球范围内公共数据泄露事

件水平指数显示,数据泄露数量呈逐年上涨的趋势。

0.00

10.00

20.00

30.00

2013 2014 2015 2016 2017

5.7510.23

7.08

13.79

26.01

数据泄露事件数量 单位:亿个

数据泄露量、危害范围日趋严重

• 2019年3月21日,约有2亿至6亿Facebook用户的密码以纯文

本方式储存。这些包含纯文本用户密码的数据元素被数千名

Facebook 工程师或开发人员访问了约 900 万次,而且这些数

据还能被2万多名Facebook员工搜索到。

• 2019年1月13日,HackenProof的安全研究员Bob Diachenko

发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

历信息已在网上被公布,疑似第三方应用泄露。

• 2018年8月28日,华住集团5亿条个人信息数据在暗网上被公

开售卖,内容涉及姓名、身份证号、家庭住址、开房记录等众

多敏感信息。华住及时报警交易未果。相关技术人员对部分泄

漏数据进行测试,数据真实性极高,并且大部分为最新泄漏出,

99%被证实。

• 2018年7月,浙江绍兴越城警方侦破30亿条用户数据窃取案。

瑞智华胜劫持运营商流量,导致百度、腾讯、阿里、今日头条

等全国96家互联网公司用户数据被窃取,威胁大量互联网用户

安全。

全球数据泄露事件持续增长

360智库2019年一季度对全球50起大规模数据泄露事件分析显

示,泄露发生最多的是个人信息,安全管理不善如系统配置不当

是数据泄露最首要的原因。

Page 5: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

cO N T E N T S

目 录

大数据安全的概念和内涵

三 大数据安全的主要挑战

大数据安全国家标准与行业标准现状四

五 大数据安全防护体系

5

一 背景

Page 6: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 6

6

保障大数据计算过程、数据形态、应用价值的安全

利用大数据技术提升安全效能、安全能力

和安全效果

保障大数据安全

大数据用于安全

大数据安全的内涵

Page 7: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 7

对大数据安全的认识和思考

数量

规模

• 体量大、结构

多样、时效强

处理

方式

• 新型计算架构、

智能算法等新

技术

应用

理念

• 辅助决策、发

现新知识、业

务流程优化

大数据新特性

从安全视角看,大数

据这些新特性,产生

了哪些影响?

Page 8: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 8

对大数据安全的认识和思考

国家

治理

经济

运行

社会

生活

大数据的决策支撑能力

大数据安全保障体系

法律

技术经济

“大安全”的视角

大数据

安全问题

1、大数据的大影响力。大数据已经对经济运行机制、社会生活方式和国家治理能力产生深刻影响,需要从“大安全”的视角认识和解决大数据安全问题。

影响力

破坏力

Page 9: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 9

对大数据安全的认识和思考2、大数据的工具化。大数据正逐渐演变为新一代基础性支撑技术和工具,大数据平台的自身安全将成为大数据与实体经济融合领域安全的重要影响因素。

智能制造业

数字化 智能化网络化

单纯窃

取数据、

瘫痪系

干预、

操纵分

析结果

直观易察觉

的系统宕机、

信息泄露

细小难以

察觉的分

析结果偏

攻击目的 攻击效果传统制造业

大数据与实体经济融合

构建更加完善的大数据平台安全保护体系

Page 10: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 10

对大数据安全的认识和思考3、大数据的流动性。大数据时代,数据在流动过程中实现价值最大化,需要重构以数据为中心、适应数据动态跨界流动的安全防护体系。

构建以数据为中心的动态、连续的数据安全防护体系

大数据时代

数据流动是“常态”

数据频繁跨界流动

引发新的安全风险

特别是在数据共享环节

数据授权

管理问题

数据流向

追踪问题

安全审计

问题

数据滥用风险

Page 11: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 11

对大数据安全的认识和思考4、大数据包含隐私信息。大数据推动数字经济新业态新模式蓬勃发展,广大民众却面临享受便捷化泛在化信息服务与保护个人信息权利之间的两难抉择。

便捷

服务

互联网

物联网移动

互联网

个人信息权利被动

削弱

引发对高水平隐私保护技术的需求和期待

数据采

集技术

数据处

理技术

数据分

析技术

威胁用户隐私安全

Page 12: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 12

从数据的基础属性层面来看,要保障数据自身在采集、传输、存储、处理、交换、销

毁等生命周期的各个阶段,不被窃取、破坏和恶意利用。

从系统的层面来看,在大数据系统的各部分采取措施,保障大数据平台传输、存储、

运算等资源和功能的运行安全,防止数据系统被破坏、被渗透或被非法使用。

从数据的资产价值层面来看,要保障个人信息、商业敏感数据乃至国家重要数据等数

据资产在应用过程中不被泄露或滥用。

平台与技术安全

数据基础层安全

数据价值层安全

大数据安全技术的内涵

Page 13: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 13

(一)平台与技术安全

• 数据平台与技术安全是对大数据平台传输、存储、运算等资源和功能的安全保障,包括传输交换安全、存储安全、计算安全、平台管理

安全以及基础设施安全。

•传输交换安全是指保障与外部系统交换数据过程的安全可控,需要采用接口鉴权等机制,对外

部系统的合法性进行验证,采用通道加密等手段保障传输过程的机密性和完整性。传输交换安全

•存储安全是指对平台中的数据设置备份与恢复机制,并采用数据访问控制机制来防止数据的越

权访问。存储安全

•计算组件应提供相应的身份认证和访问控制机制,确保只有合法的用户或应用程序才能发起数

据处理请求。计算安全

•平台管理安全包括平台组件的安全配置、资源安全调度、补丁管理、安全审计等内容。平台管理安全

•平台软硬件基础设施的物理安全、网络安全、虚拟化安全等,是大数据平台安全运行的基础。基础设施安全

Page 14: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 14

数据采集

数据传输

数据存储

数据使用

数据共享

数据销毁

数据安全管理 质量管理 数据识别 数据分类分级 数据视图 授权管理 监控与审计 合作管理

数据全生命周期安全

数据安全保护 源数据认证 数据加密 数据隔离 防泄漏 文件加密 数据备份 数据溯源 数据销毁

数据运行安全

数据系统安全

合作伙伴监管网络系统管理平台安全运营系统安全运营

安全规划 安全方案设计 安全设计评审

安全建设 安全开发建设 安全上线验收

安全运行 安全运营维护 安全监督审计 安全退服下线

(二)数据基础层安全

数据基础安全

• 数据基础层安全包括数据运行安全和数据系统安全。数据运行安全是大数据全生命周期的运行安全,数据系统安全是数据系统规划、建

设运营的运营、管理和监督等安全保障。

责任和评价考核 数据安全计划 数据安全风险评估 数据安全事件应急 数据安全教育 安全培训

Page 15: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 15

(三)数据价值层安全

国家重要数据安全

• 向所在地网信部门备案

• 明确数据安全责任人

• 利用必要的技术手段进行重要数据安

全防护,如数据分类策略、加密、备

份等。

• 发布、共享、交易或向境外提供重要

数据前,应当评估可能带来的安全风

险,并报经行业主管监管部门同意。

企业数据资产安全

• 企业数据资产机密性、完整性、可用

性、可控性

• 企业敏感数据安全

• 数据应用安全

• 数据合作共享安全

• 数据服务安全

个人信息保护

• 个人信息的收集合法、正当、必要

• 保障个人信息收集使用的安全

• 个人隐私保护

• 防止个人信息泄露、毁损、篡改或者

丢失

Page 16: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

cO N T E N T S

目 录

数据安全的概念和内涵

三 大数据安全的主要挑战

大数据安全国家标准与行业标准现状四

五 大数据安全防护体系

16

一 背景

大数据安全的概念和内涵二

Page 17: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 17

(一)平台安全问题与挑战

平台数据安全

平台管理安全

1、大数据平台在Hadoop开源模式下缺乏整体安全规划,安全机制存在局限性

• 依赖于Linux的身份和权限管理机制,不能满足基于角色的身份管理和细粒度访问控制等新的安全需求

身份管理和访问控制

• 无原生安全审计功能,需要使用外部附加工具进行日志分析

安全审计

• 企业开发过程对数据安全关注较少;• 开源组件缺乏严格的测试管理和安全

认证,对组件漏洞和恶意后门的防范能力不足。

潜在隐患

Hadoop平台安全机制局限性

2013年到2017年,Hadoop漏洞数量共计18个,其中有5个是关于数据泄露的漏洞,并且漏洞数量逐年增长

2013-2017年Hadoop漏洞统计图

Hadoop平台安全机制

平台安全机制

在可信环境内部署使用,没有设计安全机制。

开源社区相继加入Kerberos认证、文件ACL访问控制、网络层加密等安全机制。

0 2 4 6 8

2013

2014

2015

2016

2017

Hadoop漏洞数量 单位:个

数据来源:CVE

Page 18: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 18

(一)平台安全问题与挑战

平台数据安全

平台管理安全

2、大数据平台服务用户众多、场景多样,传统安全机制的性能难以满足需求

• 多源数据大量汇聚增加了访问控制策略制定及授权管理的难度,过度授权和授权不足现象严重。

访问控制的主体复杂化

•大数据的数据存储和流动场景复杂,使得数据加密的实现变得异常困难;

•海量数据的密钥管理也是亟待解决的难题。

数据加密实现困难

•非结构化和半结构化数据精细化描述困难,无法准确为用户指定其可以访问的数据范围,难以实现最小授权原则。

访问控制的客体描述困难

Page 19: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 19

(一)平台安全问题与挑战

平台数据安全

平台管理安全

开源Hadoop生态系统的认证、权限管理、加密、审计等功能均通过对相关组件的配置来完成,无配置检查和效果评价机制。

大规模的分布式存储和计算架构也增加了安全配置工作的难度,对安全运维人员的技术要求较高。

3、大规模分布式存储和计算模式导致安全配置难度成倍增长

2017年6月,Shodan互联网搜索

引擎分析显示, Hadoop服务器

因配置不安全导致海量数据暴露,

涉及4500台HDFS服务器,数据量

高达5.12 PB。

2017年初,针对Hadoop

的勒索攻击攻击事件:平台

配置不当,大量暴露在公网

上的端口给了黑客可乘之机。

Hadoop系统安全配置难度大 Hadoop系统配置不当导致的数据泄露事件频发

Page 20: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 20

(一)平台安全问题与挑战

平台数据安全

平台管理安全

4、针对大数据平台的网络攻击手段呈现新特点,传统安全监测技术暴露不足

攻击呈现新特点,发现难度较大。传统以实时检测、实

时阻断为主体的防御方式难以有效发挥作用。

大数据的价值低密度性,使得安全分析工具难以聚焦在

价值点上,黑客可以将攻击隐藏在大数据中,传统安全

策略检测存在较大困难。

攻击行为特征难以提取:如

0day漏洞、未知木马

单点隐蔽能力强:如隐蔽通

道、伪造合法签名

攻击渠道多样化:如社交攻

击、漏洞利用

攻击持续时间长:分步骤攻

击,几个月或更长

APT攻击新特点

Verizon公司《2018年数据泄露调查报告》显示,48%的数据泄露与黑客攻击有关,其中,社交攻击、DDoS以及特权滥用是主要的黑客攻击方式。

0% 10% 20% 30% 40% 50% 60%

物理攻击

特权滥用

社会工程学攻击

配置或操作错误

恶意软件

黑客攻击

数据泄露中主要攻击手段统计

数据来源:Verizon

Page 21: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 21

(二)数据安全问题与挑战

1、数据采集环节成为影响决策分析的新风险点

为数据的真实性和完整性

检验带来困难

来源

复杂

体量

种类

黑客向数据采集端注入脏数

破坏数据真实性

将数据分析的结果引向预设

的方向

实现操纵分析结果的攻击目

无严格

的真实

性鉴别

无严格

的可信

度鉴别

无严格

的监测

手段

无法剔除虚假、恶意数据

Page 22: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 22

(二)数据安全问题与挑战

2、数据处理过程中的机密性保障问题逐渐显现

数字经济时代,组

织需要参与产业链

协同,以数据流动

与合作为基础进行

生产活动。

跨系统的访问或多

方数据汇聚进行联

合运算。

需要保证个人信息、

商业机密或独有数

据资源在合作过程

中的机密性。

Page 23: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 23

(二)数据安全问题与挑战

3、数据流动路径的复杂化导致追踪溯源变得异常困难

2018年3月 “剑桥分析”事件

Facebook对第三方使用数据缺乏有

效的管理和追责机制

8700万名用户资料被滥用

股价暴跌、信誉度下降

简单流动模式• 单向• 单路径• 组织内部

复杂流动模式• 双向• 多路径• 跨组织

数据流动路径变得交错复杂

异构网络环境

跨越数据控制者

跨安全域

数据溯源中数据标记的可

信性验证困难

数据标记与数据内容之间

捆绑的安全性难以保证

追踪溯源困难

Page 24: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 24

(三)隐私保护问题与挑战

1、传统隐私保护技术因大数据超强的分析能力面临失效的可能

传统隐私保护技术

掩码

面临失效可能

大数据环境下数据与挖掘技术的新特点带来隐私泄露风险

对多来源多类型数据

集进行关联分析和深

度挖掘

可能复原匿名化数据

去标识

Page 25: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 25

(三)隐私保护问题与挑战

2、传统隐私保护技术难以适应大数据的非关系型数据库

数据库类型 数据类型 数据总量占比 隐私保护技术

关系型数据库 结构化数据 20% 去标识化、匿名化

非 关 系 型 数 据 库(NoSQL)

动态变化、半结构化和非结构化数据

80%目前尚无严格的访问控制机制及相对完善的隐私保护工具

Page 26: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

cO N T E N T S

目 录

数据安全的概念和内涵

数据安全的主要挑战

大数据安全国家标准与行业标准现状四

五 大数据安全防护体系

26

一 背景

大数据安全的概念和内涵二

三 大数据安全的主要挑战

Page 27: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 27

27

基础类标准明确大数据生态中各类安全角色及相关的安全活动或功

能定义。

平台和技术针对大数据服务基础平台、业应用,包括安全技术与机

制、系统平台安全和运维三部分。

数据安全类主要包括个人信息、重数据跨境安全等管理与技术标

准,包括分类级、 去识化跨境风险评估等内容。

服务安全类针对开展大数据服务过程中的活动、角色与职责系统和

应用服务等要素,包括大数据交易服务安全要求、实施指南及评估

方法等。

应用类标准主要是针对重要行业和领域大数据应用,对涉及国家安

全、国计民生、公共利益的大数据应用的安全防护,指导相关的大

数据安全规划、建设和运营工作。

信安标委发布的《大数据安全标准化白皮书》制定了大数据安全标准图谱。围绕数据安全,需要从基础、平台

和技术、数据安全、服务安全、应用安全五大方面主题开展安全标准研究。

(一)大数据安全国家标准现状 1、TC260 SWG-DBS标准体系框架

Page 28: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 28

标准名称 主要内容 编制进度

大数据服务安全能力要求 规定了大数据服务提供者应具有的大数据服务安全能力,包括大数据组织相关基础安全能力、数据生命周期相关的数据服务安全能力以及大数据服务平台与应用相关的系统服务安全能力。

已发布

数据出境安全评估指南 提出了个人信息和重要数据出境安全评估的框架、流程、要点和方法。 送审稿

大数据安全管理指南 提出大数据安全管理基本原则、大数据安全管理基本概念和大数据安全风险管理过程。提出大数据的数据收集、数据存储、数据使用、数据分发、数据删除等主要阶段的基本概念和管理要求。规范了组织内部不同大数据角色的安全职责。

报批稿

数据安全能力成熟度模型 基于大数据环境下电子化数据在组织机构业务场景中的数据生命周期,从组织建设、制度流程、技术工具以及人员能力四个方面构建了数据安全过程的规范性数据安全能力成熟度分级模型及其评估方法。

报批稿

数据交易服务安全要求 规定了数据交易服务涉及的交易参与方、交易对象和交易过程的安全要求。 报批稿

政务信息共享 数据安全技术要求

确立了政务信息共享数据安全框架,规定了政务信息共享过程中共享数据准备、共享数据交换、共享数据使用阶段的数据安全技术要求以及相关基础设施的安全技术要求。

征求意见稿

个人信息安全规范 规范了开展收集、保存、使用、共享、转让、公开披露等个人信息处理活动应遵循的原则和安全要求。 已发布

个人信息去标识化指南 描述了个人信息去标识化的目标和原则,提出了去标识化过程和管理措施。 报批稿

个人信息安全工程指南 描述了个人信息安全工程目标,给出了这需求分析、产品设计、产品开发、测试审核、发布部署、运行维护等系统工程阶段的个人信息保护实施指南。

征求意见稿

个人信息安全影响评估指南 规定了个人信息安全影响评估的基本概念、框架、方法和流程。 征求意见稿

2、数据安全主要国家标准汇总

(一)大数据安全国家标准现状

Page 29: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 29

大数据安全服务能力要求

目标

Page 30: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 30

大数据服务中没有承载重要数据,且该服务不能

正常提供服务或遭受破坏时,对国家经济发展和

社会公共利益影响有限,对国家安全和国计民生

没有影响的。

大数据服务中承载有重要数据,或在不能正常提供

服务或遭受破坏时,对国家经济发展和社会公共利

益造成的影响较大,或者会影响国家安全和国计民

生的。

大数据安全服务能力要求

二级安全要求

一般要求

增强要求

Page 31: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 31

分布式处理安全数据分析安全数据正当使用密文数据处理数据脱敏处理数据溯源

数据处理

介质使用管理数据销毁处置介质销毁处置

数据销毁

数据分类分级数据收集和获取数据清洗转换与加载质量监控

数据采集

存储架构逻辑存储访问控制数据副本数据归档数据时效性

数据存储

数据导入导出安全数据共享安全数据发布安全数据交换监控

数据交换数据传输

S1

S2

S3

S4

S5

S6

大数据安全服务能力

通道安全接口安全身份鉴别审核与监控

大数据安全服务能力要求

Page 32: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 32

• 标准的范围:

• 基于大数据环境下电子化数据在组织机构业务场景中的数据生命周

期,从组织建设、制度流程、技术工具以及人员能力四个方面构建了

数据安全过程的规范性数据安全能力成熟度分级模型及其评估方法。

• 标准的定位:以《信息安全技术 大数据服务安全能力要求》中的

安全要求为基础,对大数据环境下各角色的组织机构的能力进行

分级评估:

• 覆盖大数据环境下的各个角色;

• 关注于组织机构的管理能力;

• 构建分级评估的模型。

数据采集安全

5级: 持续优化

4级: 量化控制

3级: 充分定义

2级: 计划跟踪

1级: 非正式执行

安全能力维度

Leve

l 2: M

an

ag

ed

数据存储安全

Leve

l 2: M

an

ag

ed

数据传输安全

Leve

l 2: M

an

ag

ed

数据处理安全

Leve

l 2: M

an

ag

ed

数据交换安全

Leve

l 2: M

an

ag

ed

数据销毁安全

能力成熟度等级

大数据安全能力成熟度评估模型

数据安全能力成熟度模型架构

Page 33: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 33

标准名称 标准号/计划号 编制进度电信和互联网服务 用户个人信息保护 定义及分类 YD/T 2781-2014 已发布

电信和互联网服务 用户个人信息保护 分级指南 YD/T 2782-2014 已发布

电信运营商大数据安全管控分级分类技术要求 2018-0162T-YD 征求意见稿

面向云服务的数据安全标记规范 2016-1905T-YD 报批稿

电信和互联网用户个人电子信息保护通用技术要求和管理要求

YD/T 2692-2014 已发布在修订

基础电信企业数据分类分级指南 YDCPZT0315-2019 已立项

基础电信企业重要数据识别指南 YDCPZT0316-2019 已立项

电信运营商的大数据应用业务安全技术要求 2014-1039T-YD 已发布

电信网数据泄露防护系统(DLP)技术要求 2018-1785T-YD 征求意见稿

大数据环境下数据库审计系统技术要求 已立项

电信网和互联网大数据平台安全防护要求 2017-0929T-YD 送审稿

电信网和互联网大数据平台安全防护检测要求 2018-1782T-YD 征求意见稿

电信网和互联网安全防护基线配置要求和检测要求--大数据组件

送审稿

1、数据安全主要行业标准汇总

(二)大数据安全行业标准现状

Page 34: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 34

标准名称 标准号/计划号 编制进度电信网和互联网数据安全风险评估实施指南 2018-1669T-YD 送审稿

电信运营商的大数据应用业务安全技术要求 2014-1039T-YD 报批稿

电信和互联网服务 用户个人信息保护技术要求电子商务服务

2015-0168T-YD 已发布

网络预约出租汽车服务平台数据安全防护要求 2017-0938T-YD 征求意见稿

使用cookie进行互联网数据采集的安全性要求 2013-2498T-YD 报批稿

基于移动互联网的汽车用户数据应用与保护技术要求

2018-0182T-YD 征求意见稿

基于移动互联网的汽车用户数据应用与保护评估方法

2018-0183T-YD 草案

工业互联网数据安全保护要求 2018-1369T-YD 征求意见稿

工业互联网安全接入技术要求 2018-0179T-YD 征求意见稿

工业互联网安全能力成熟度评估规范 2018-1395T-YD 已立项

(二)大数据安全行业标准现状 1、数据安全主要行业标准汇总

Page 35: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 35

大数据平台安全防护要求

数据

安全 数据脱敏

采集安全 传输安全 存储安全 处理安全

共享安全归档与销毁

安全

导入导出

安全

平台

安全身份鉴别 访问控制 接口安全 多租户管理

基础

安全物理安全 网络安全 主机安全 云平台安全

安全

管理

管理制度

机构和人员

系统建设

安全管理

安全运维

管理

(1)大数据平台基础设施安全

• 大数据平台安全的运行环境方面的安全保障要求,包括物理安全、网络安全、

主机安全、云平台安全等内容 ,是大数据平台安全的基础。

(2)大数据平台安全

• 平台安全:平台安全是指平台组件自身的身份鉴别、访问控制、接口安全、多

租户管理等要求,是对大数据平台传输、存储、运算等资源的安全防护要求;

• 数据安全:数据安全是指为支撑数据流转安全所应提供的安全功能,包括数生

命周期和脱敏等安全功能等据采集、数据传输、数据存储、数据处理、数据共

享、数据归档与销毁、数据脱敏、数据导入导出等内容 。

(3)管理安全要求

• 是指大数据平台管理方面的要求,包括管理制度、机构和人员管理、系统建设

管理、运维管理等内容。

Page 36: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 36

• 伴随着信息化的不断发展,数据源不断增加,系统功能特性支撑对内运营和对外数据变现业务不断丰富,关于数据安全的问题与挑战日益增加,大数据平台安全越发重要,大数据平台安全基线规范的制定也成为数据安全的重中之重。

覆盖面广

定期更新

准入条件成果可固化

可操作性强

涵盖大数据平台通过组件框架,

以及各类软、硬件系统及设备

针对每个安全基线检查项均有简洁的安全性说明及操作说明

周期性的对基线要求进行补充和更新

基线规范可以被集成为检查工具,为安全合规检查提供指导规范

安全基线将作为相关设备和

系统安全准入的必要条件

安全基线

制定目标

电信网和互联网安全防护基线配置要求和检测要求--大数据组件

Page 37: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 37

电信网和互联网安全防护基线配置要求和检测要求--大数据组件

基本安全要求

组件安全

认证、访问控制、授权、审计、最小化、版本更新、数据安全等

技术安全

可信任、可用性、可追溯、保密性、健壮性

安全控制点

集群管理

身份认证

访问控制

数据保护

日志审计

多租户安全

版本及补丁管理

默认路径

采集组件KafkaFume

处理组件

Yarn&MRSparkHiveStormZookeeperImpala

存储组件

MPPHbaseHdfsRedis

Page 38: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

cO N T E N T S

目 录

数据安全的概念和内涵

数据安全的主要挑战

五 大数据安全防护体系

38

一 背景

大数据安全的概念和内涵二

三 大数据安全的主要挑战

大数据安全国家标准与行业标准现状四

Page 39: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 39

大数据安全技术总体视图

平台安全

平台自身基础组件安全+

为运行其上的数据和应用提供安全机制

数据安全

为数据流动过程提供安全防护手段

隐私保护

对个人数据的隐私保护

Page 40: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 40

(一)大数据平台安全技术

1、Hadoop开源社区增加了基本安全机制,但安全能力不能满足现实需求

Hadoop开源社区的安全机制 开源安全机制的不足之处

Kerberos认证方式Hive支持基于角色的访问控制,HBase和Accumulo提供了基于标签的访问控制

Hadoop开源系统各组件

均提供日志和审计文件

支持静态加密和动态加

身份认证 访问控制

安全审计 数据加密

认证颗粒度基于操作系统用户,无法支持系统内组件之间的身份认证

细粒度访问控制较为困难,控制策略和部署复杂

各组件分别进行日志和审计记录,实现全系统的安全审计较为困难

密钥管理是难题

Page 41: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 41

(一)大数据平台安全技术

2、商业化大数据平台解决方案已经具备相对完善的安全机制

安全管理和审计 访问控制

如Manager、Ranger、Guardian

集中系统运维、安全策略管理和审计

统一的配置管理界面,解决了安全策略配置和管理繁杂的难题

边界防护,保证Hadoop集群入口的安全

集中身份管理和单点登录等,简化了认证流程

身份认证

通过基于角色或标签的访问控制策略,实现资源的细粒度管理

加密和密钥管理

灵活的加密策略

支持与系统HSM系统集成的密钥管理方案

这类安全方案的安全机制是针对本平台开发,不适于其他平台的安全加固。

Page 42: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 42

平台安全基线配置

提高平台自身安全性

集中安全管理

支持安全、审计、操作三权分立

访问控制支持多种访问控制模

式和细粒度

身份认证

兼容Kerberos,支持多因素

3、商业化通用安全组件可以为开源大数据平台提供安全加固方案

这类安全方案的安全机制是通用的,为开源大数据平台提供了较完备的安全加固方案。

(一)大数据平台安全技术

Page 43: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 43

(二)数据安全技术

1、敏感数据识别技术作为数据安全监控的必要技术条件逐步实现自动化

敏感数据识别是数据保护的前提

关键字、字典和正则表达式匹配

机器学习技术实现自动化识别

引入大数据分析技术、机器学习算法

2、数据防泄露技术发展相对成熟并向智能化方向演进

总体趋势:向“智能安全”方向演进,智能化数据识别和分类分级保护,智能化安全风险识别

基于预设规则的识别与监控

Page 44: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 44

(二)数据安全技术

3、结构化数据库安全防护技术基本成熟,非结构化数据库安全防护亟需加强

非结构化数据库保护技术

结构化数据库保护技术

Page 45: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 45

(二)数据安全技术

4、密文计算技术因多源数据计算机密性需求成为研究热点

在保证数据机密性的基础上实现数据的流通和合作应用一直是困扰产业界的难题

密文计算的目标:实现数据“可用不可见”

多方安全计算

同态加密

让工人可以对金块进行加工(数据处理),但是不能得到任何金子(不泄露数据)。

对经过同态加密的数据处理得到一个输出,将这一输出进行解密,其结果与统一方法处理未加密的原始数据得到的输出结果一致。

解决一组互不信任的参与方之间保护隐私的协同计算问题。

输入独立性 计算正确性 不泄露输入值给其他

成员

密钥共享 沙米尔密钥共享 多方协议

密文计算的问题:一直在改进,但计算效率低,需要在实用性方面加强研究

开源库:The HElib 平均加密时间 5-10 分钟FHEW 基于全同态加密方法,提高运算效率TFHE 新的同态计数器TBSR,将TLWE转化为低噪声的TRGSW密文:137毫秒

Page 46: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 46

(二)数据安全技术

5、数字水印和数据血缘追踪技术发展明显滞后于实际需求

数字水印技术 数据血缘追踪技术

存在的问题:• 一般针对静态的数据集• 不能满足大数据环境下数据量巨大、更新

速度极快的需求

实现方式:• 数据库增加伪行、伪列• 图像、音频、视频等增加隐蔽性水印

数据血缘记录数据产生、加工融合、流转流通,到最终消亡的整个过程,可用于实现数据来源追踪、数据异常分析等功能。

存在的问题:应用尚不广泛,技术成熟度还未达到大规模实际的应用需求

Page 47: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 47

(三)隐私保护技术 1、数据脱敏技术发展成熟,是目前应用最广泛的隐私保护技术

脱敏算法选择关键:可用性和隐私保护的平衡

基于加密算法

的脱敏

• 低层次脱敏,脱敏后

完全失去业务属性

• 适用于机密性要求

高、不需要保持业务

属性的场景

不可逆的数据失真

技术

• 通过算法可以生成

“看起来很真实的假

数据”

• 适用于群体信息统计

或(和)需要保持业

务属性的场景

可逆置换算法

• 兼具可逆和保证业务

属性的特征

• 适用于需要保持业务

属性或(和)需要可

逆的场景

Page 48: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 48

(三)隐私保护技术

2、匿名化算法将成为未来解决隐私保护问题的有效途径

定义:数据匿名化算法实现根据具体情况有条件地发布部分数据,或者数据的部分属性内容。作用:可以防止用户敏感数据被泄露,同时又能保证发布数据的真实性

隐私性和可用性间的平衡问题

执行效率问题

度量和评价标准问题

动态重发布数据的匿名化问题

多维约束匿名问题等

要解决的问题

目前,匿名化算法的成熟度和

使用普及程度还不是很高

后续匿名化算法会在隐私保护

方面得到越来越多的应用

技术展望

Page 49: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 49

(四)大数据安全保护技术发展现状总结

国内外大数据平台安全、数据安全、隐私保护相关的技术已经取得了一定的进展,能够初步解决本报告第三章提到的安全问题;但在应对一些新的网络攻击形式、新数据应用场景、隐私保护需求方面,大数据安全技术的现有能力和水平还存在一定差距。

• 集中的安全配置管理和安全

机制部署能够基本满足目前

平台的安全需求,但平台的

漏洞扫描与攻击监测技术相

对薄弱。

大数据平台安全

• 数据安全监控和防泄露技术

相对成熟,数据的共享安

全、非结构化数据库的安全

防护以及数据泄露溯源技术

亟待改进。

数据安全

• 技术的发展明显无法满足当

前迫切的隐私保护需求,大

数据应用场景下的个人信息

保护问题需要构建法律、技

术、经济等多重手段相结合

的保障体系。

隐私保护

Page 50: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/ 50

大数据安全技术未来发展建议

需要站在总体安全观的高度,构建大数据安全综合防御体系

加强隐私保护核心技术产业化投入,兼顾数据利用和隐私保护双重需

以关键环节和关键技术为突破点,完善数据安全技术体系

从攻防两方面入手,强化大数据平台安全保护

50

平台安全

数据安全

隐私保护

重视大数据安全评测技术的研发,构建完备的安全检测评估体系

Page 51: 大数据安全技术与防护体系eversec.com.cn/wp-content/uploads/2019/03/大数据安全技术与防护体系0827.pdf · 发现,MongoDB数据库中有超过2.02亿中国求职者的详细简

http://www.caict.ac.cn/中国信息通信研究院

国家高端专业智库 行业创新发展平台

感谢聆听 !