Upload
thinkinlamp
View
4.013
Download
1
Embed Size (px)
DESCRIPTION
Citation preview
2
Agenda
Big Data!数据仓库
数据仓库 2.0基于 Infobright的解决方案
3
Big Data
`
10TB数据—“大”还是“小”?
大数据的商业价值
何谓之“大”?
大数据是什么?
4
数据仓库
5
数据仓库
数据仓库是一种体系结构,而非一种技术
数据仓库为其他形式的信息处理提供了理想的基础
事实只有一个版本
如果需要,可以重新调整数据
可以为新的、未知的应用随时提供数据
降低企业获取信息的代价
6
大型数据仓库
数据仓库包含历史
低粒度级采集数据——数据仓库的灵活性数据种类繁多
历史数据 + 细节数据 + 多种数据 = 大量数据
7
大型数据仓库
下载 1 小时索引 15分钟访问 25毫秒下载 12小时
索引 72小时访问 3 秒
8
数据量的影响
花销 ( 成本 )存储、分析处理
有效性
企业是否使用收集的所有数据
数据管理
数据量的不断增加、数据管理规则需要改变
9
数据仓库的特性
主题导向
集成性
时间差异性
不变动性
10
数据仓库 SDLC收集需求
分析
设计
编程
测试
集成
实现
实现数据仓库集成数据 (ETL)检验偏差针对数据编程设计 DSS系统分析结果理解需求
11
DW2.0
622407magic number?
12
DW2.0 vs DW1.0
数据生命周期的准确认识
交互、整合、近线、归档
元数据的重要性
技术基础架构的流动特性
13
Infobright
??
14
行存储 vs 列存储
15
行存储 vs 列存储
16
Infobright架构
17
知识网格 KG
18
KG工作原理
19
IB数据检索流程
20
IB的价值
21
水平扩展数据分析中间件
分而治之
按需而分
仓库 2.0启示
22
Q&A 时候不早啦 ! Thanks!
大家都累了 ...me 2...opentalk 2012