29
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | e触即发”项目简介和 Oracle大数据方案介绍 FSI Sales Consultant Oracle Confidential – Internal

How to Use the PowerPoint Template · 管理 元数据 数据质量管理 任务调度与管理 信息安全 信息生命周期 基础设施(服务器、存储、网络) 基础

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: How to Use the PowerPoint Template · 管理 元数据 数据质量管理 任务调度与管理 信息安全 信息生命周期 基础设施(服务器、存储、网络) 基础

Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |

“e触即发”项目简介和 Oracle大数据方案介绍

杨 雷 FSI Sales Consultant

Oracle Confidential – Internal

1

Page 2: How to Use the PowerPoint Template · 管理 元数据 数据质量管理 任务调度与管理 信息安全 信息生命周期 基础设施(服务器、存储、网络) 基础

Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |

Page 3: How to Use the PowerPoint Template · 管理 元数据 数据质量管理 任务调度与管理 信息安全 信息生命周期 基础设施(服务器、存储、网络) 基础

Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |

银行理财产品的精准营销 基于客户行为的精准推荐

客户的困惑

•减少排队等待时间

•更好的利用资金,获取最大的

收益

•获得更好的服务

银行客户经理的困惑

•更好的了解客户

•推荐最合适的理财产品给客

•提高服务质量

•更好的客户体验

Page 4: How to Use the PowerPoint Template · 管理 元数据 数据质量管理 任务调度与管理 信息安全 信息生命周期 基础设施(服务器、存储、网络) 基础

Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |

根据当前客户信息、网点信息和客户偏好实时决策,提供最合适的基金产品/银行卡业务

实时发送推荐短信

基于批处理了解推荐被接受/拒绝和并随后调整和优化推荐模型

返回纸质推荐信息

排队机

业务办理

1

2

排队信息实时传输

Oracle大数据整体解决方案

4

通知网点值班经理

3

5

排队机交叉销售业务流程

Page 5: How to Use the PowerPoint Template · 管理 元数据 数据质量管理 任务调度与管理 信息安全 信息生命周期 基础设施(服务器、存储、网络) 基础

Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |

开始

客户持卡在排队机上刷卡

并行加工预处理客户在银行所有的历史数据

实施捕获客户信息

总行T+1的方式下 发增量资金交易流水数据

Hadoop集群

精细化加工客户数据,形成客户宽表

Oracle RAC/Exadata

按拟定的业务规则对客户分类和打标签

Oracle Data Mining

实时匹配客户数据,推荐理财产品

Real Time Decision

理财产品推送给客户(凭据/短信)或者值班经理

Oracle大数据整体解决方案

ESB

Big Data Connector

1. 反馈业务推荐办理情况; 2. RTD自学习,自动优化算法

客户明细数据存储在NoSQL数据库,提供历史数据查询

排队机

网上银行

手机银行

SequoiaDB

排队机交叉销售数据流程

Page 6: How to Use the PowerPoint Template · 管理 元数据 数据质量管理 任务调度与管理 信息安全 信息生命周期 基础设施(服务器、存储、网络) 基础

Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |

大数据平台

排队机

电子渠道 (网站、手机应用)

核心业务系统

短信网关

营销管理

绩效分析

银行的其他系统 客户标签/Web服务

营销活动成交记录

排队信息/JMS

资金交易流水/FTP

产品推荐/Web 服务

排队信息/Web协议

产品推荐/JMS

实时事件处理 (识别、过滤、合

并、聚合) 实时决策引擎

营销事件

客户标签

Hadoop CRM 客户基本资料/FTP

RDBMS

营销活动 客户资料

营销反馈

排队机交叉销售总体架构

产品推荐/营销结果回馈

基金交易信息 基金交易结果回馈

产品推荐

Page 7: How to Use the PowerPoint Template · 管理 元数据 数据质量管理 任务调度与管理 信息安全 信息生命周期 基础设施(服务器、存储、网络) 基础

Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |

后台系统 中国银行大数据平台数据分布视图

实时事件处理

数据集成

抽取

清洗

转换

加载

搜集

管理 元数据 数据质量管理 任务调度与管理 信息安全 信息生命周期

基础设施(服务器、存储、网络)

基础数据(Hadoop) 数据仓库(RDBMS)

算法 点击流 刷卡流 事件触发规则 营销规则 决策模型

客户基本资料 客户标签 社交网络图谱

数据源

排队机

理财

网站

手机

存/取款

信用卡

存款

实时决策引擎

取款

转账 信用卡

代收代付

个人理财

基金 贵金属

产品 客户分群

历史营销活动 订购关系

短信网关

营销管理 绩效分析

排队机

MIS办公

Page 8: How to Use the PowerPoint Template · 管理 元数据 数据质量管理 任务调度与管理 信息安全 信息生命周期 基础设施(服务器、存储、网络) 基础

Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |

流 获取 组织 分析 决策

Oracle是数据库和信息管理行业的领导者。 Oracle提供的所有组件,你需要从你的大数据平台得到真正的结果

大道至简---软硬一体优化集成的Oracle大数据平台 加快端到端的解决方案上市时间和降低风险,简化IT,聚焦业务

InfiniBand InfiniBand Data Warehouse

In-D

ata

base

A

naly

tics

Oracle Advanced Analytics

Oracle Database

BIEE+

ESSBase

TimesTen

Endeca

Hadoop

Open Source R

Oracle NoSQL Database

OEP

Coherence

Big Data SQL

Page 9: How to Use the PowerPoint Template · 管理 元数据 数据质量管理 任务调度与管理 信息安全 信息生命周期 基础设施(服务器、存储、网络) 基础

Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |

Oracle企业级大数据解决方案的优势

商业分析 数据发现

数据池 数据仓库

数据源

数据应用 商业智能

Oracle Database

Oracle Industry Models

Oracle Advanced

Analytics

Oracle Spatial & Graph

BDA

Hadoop

Oracle NoSQL DB

Oracle R

Oracle数据库

内存选项/多租户

Oracle高级分析

地理和图形选件

Exadata

Oracle Big Data Connectors

Oracle Data Integrator

Oracle Big Data Connectors

Oracle Data Integrator

集成

安全

管理

Big Data SQL

• 建立全数据池,扩展企业传统数据仓库,接纳新数据

• 从大数据中提取有价值信息,与业务信息融合

获取和组织:企业统一全数据池

• 实现大数据和业务数据基于SQL的融合处理,重用已有技能,工具和经验

• 统一的企业级数据挖掘和数据探索能力

分析:数据发现和数据挖掘

• 丰富的图表和快如闪念的商业智能

• 重复利用现有的工具,快速应用

决策:商业智能和数据应用

Page 10: How to Use the PowerPoint Template · 管理 元数据 数据质量管理 任务调度与管理 信息安全 信息生命周期 基础设施(服务器、存储、网络) 基础

Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |

Coordination

Data

Integration

Fast

Read/Write

Access

Languages / Compilers

Workflow Scheduling Metadata

APACHE

ZOOKEEPER

APACHE FLUME,

APACHE SQOOP APACHE HBASE

APACHE PIG, HIVE, MAHOUT

APACHE OOZIE APACHE OOZIE APACHE HIVE

File System Mount UI Framework SDK

FUSE-DFS HUE HUE SDK

HDFS,

MAPREDUCE

Oracle Big Data Appliance 提供更多能力

R

Oracle

NoSQL

Database

Clo

udera M

anager E

E

Big Data

Discovery

Oracle

E

nterprise M

anagem

ent

Big Data SQL

Oracle

Big Data

Connector

Page 11: How to Use the PowerPoint Template · 管理 元数据 数据质量管理 任务调度与管理 信息安全 信息生命周期 基础设施(服务器、存储、网络) 基础

Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |

Big Data Appliance Hadoop专业管理和运维 Cloudera Enterprise & Cloudera Manager

自动部署和Hadoop准备检查 部署和配置HDFS, MapReduce,Flume,Hbase,Hue,Oozie 和 Zookeeper Services 配置高可用性和联邦,多集群管理 审计跟踪,智能日志管理 工作流 (如增加主机,重启服务等),配置版本和历史 监控HDFS,MapReduce,MapReduce2,HBase,Hue,Flume,Hive,Hue,Oozie和Zookeeper 针对HDFS和Hive的备份/灾难恢复 主动的健康状况检查,状态和健康状况总结 热图(Heatmaps)/性能监控 LDAP授权,Kerberos配置,运维报告,事件管理和预警,活动监控 支持集成和定期诊断,滚动更新

Page 12: How to Use the PowerPoint Template · 管理 元数据 数据质量管理 任务调度与管理 信息安全 信息生命周期 基础设施(服务器、存储、网络) 基础

Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |

全套BDA硬件的监控管理

OEM集群控制能力

与Cloudera Manager的深度集成

BDA – Oracle Enterprise Manager全面硬件监控和管理

Page 13: How to Use the PowerPoint Template · 管理 元数据 数据质量管理 任务调度与管理 信息安全 信息生命周期 基础设施(服务器、存储、网络) 基础

Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |

大数据安全应对策略 - Oracle Audit Vault和Database Firewall

Databases

Relational Data

Hadoop

Non-Relational Data Operating Systems Audit Vault

One

针对所有数据进行统一审计和授权;

审计报告、预警和规则集中管理。

大数据逐渐会获取企业敏感信息,这些数据需要有限制的被使用;

与成熟的关系型数据库不同,大数据没有很好的权限控制方案

Page 14: How to Use the PowerPoint Template · 管理 元数据 数据质量管理 任务调度与管理 信息安全 信息生命周期 基础设施(服务器、存储、网络) 基础

Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |

Oracle Big Data SQL 支持数据发现和预测,快速简单访问所有数据,治理和保护所有数据安全

易于理解的SQL语句

Relational Hadoop

MapReduce/Hive/其他计算框架

NoSQL

Java/C/Ruby/Python/PHP/Perl编程

SQL

Oracle Big Data SQL •丰富的SQL支持,利用现有技能 •同时查询大数据和关系型数据 •利用数据库安全,实现数据治理 •性能优化:并行,存储索引,本地数据过滤,最小化数据移动

企业处理大数据的难点 •技能:需要学习编程和新工具 •集成:难于把大数据加入已有架构 •安全:缺乏全面的治理和执行手段 •性能:实时响应性和交互性不强

SQL X X

Page 15: How to Use the PowerPoint Template · 管理 元数据 数据质量管理 任务调度与管理 信息安全 信息生命周期 基础设施(服务器、存储、网络) 基础

Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |

数据多份冗余存储

没有NameNode单点故障

NameNode自动故障切换

Metadata多份数据同步

Oracle Big Data Appliance高可用解决方案 Cloudera CDH 5.2.1

Active Name Node

Passive Name Node

Page 16: How to Use the PowerPoint Template · 管理 元数据 数据质量管理 任务调度与管理 信息安全 信息生命周期 基础设施(服务器、存储、网络) 基础

Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |

Oracle Big Data Connector Hadoop、NoSQL与RDBMS的融合

HIVE

HDFS

HDFS

Datafile_part_1

Oracle Database

Oracle SQL Connector for

Hadoop

外部表

SQL查询

聚合

KVInputFormat 外部表

Oracle NoSQL Database

Hadoop

Oracle Data Integrator

Datafile_part_x

Oracle Loader Hadoop

关系型结构化数据

• Oracle Loader for Hadoop • Oracle SQL Connector for Hadoop • Oracle Data Integrator Application for Hadoop • Oracle R Connector for Hadoop

Page 17: How to Use the PowerPoint Template · 管理 元数据 数据质量管理 任务调度与管理 信息安全 信息生命周期 基础设施(服务器、存储、网络) 基础

Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |

Oracle XQuery for Hadoop

Acquire – Organize – Analyze

Oracle Big Data Connectors

Oracle Data Integrator Oracle

Loader for

Hadoop

OXH is a transformation engine for Big Data

XQuery language executed on the Map/Reduce framework

XQuery

for $ln in

text :collect ion()

let $f :=

tokenize($ln)

where $f[1] = 'x '

return

text :put ($f[2] )

Map/Reduce

Execut ion Plan

M/R

M/R

M/R

M/R

Map/Reduce

Worker Nodes

HDFS

OXH

Engine

Page 18: How to Use the PowerPoint Template · 管理 元数据 数据质量管理 任务调度与管理 信息安全 信息生命周期 基础设施(服务器、存储、网络) 基础

Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |

Oracle 数据库强大分析平台

Oracle Advanced Analytics

2 英里

统计

数据挖掘

文本

图形

空间

语义

Page 19: How to Use the PowerPoint Template · 管理 元数据 数据质量管理 任务调度与管理 信息安全 信息生命周期 基础设施(服务器、存储、网络) 基础

Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |

OAA价值优势 1. 功能强大

可扩展的库内R编程语言实施

分析过程的数据准备是自动执行的

库内机器学习技术,可扩展的分布式并行执行

数据继续保留在数据库里

S avings

多种接口选择 – SQL, R, IDE, GUI

最快和最灵活的分析部署选择

Value Proposition

• 最短的从“数据”到“可操作的信息”时间周期 • 最快的分析型开发 • 最快的库内打分引擎 • 灵活的部署选择

• 消除重复数据的最低拥有成本 • 安全,可伸缩和管理性好

可以导入第三方模型

模型 “打分”

嵌入式的数据预处理

数据准备

模型建立

Oracle高级分析

秒, 分钟 或者 小时

R

传统分析

小时, 天 或者 周

数据抽取

数据准备 &

数据预处理

数据挖掘 模型建立

数据挖掘 模型 “打分”

数据准备 和 处理

数据导入

源 数据

数据

工作区

分析

过程 处理

输出 目标

R

Page 20: How to Use the PowerPoint Template · 管理 元数据 数据质量管理 任务调度与管理 信息安全 信息生命周期 基础设施(服务器、存储、网络) 基础

Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |

OAA价值优势 针对从业务用户到数据科学家不同用户的

GUI和IDE选择 • Oracle Data Miner/SQL Developer “Work flow”

GUI

– 拖拽式图形化界面

– 与SAS/Enterprise Miner和 SPSS Predictive Modeler具备竞争优势

– 即刻部署,即刻生成SQL Script code

• R IDEs支持

– 直接访问Oracle数据库的数据

– 编写R脚本;在库内运行

2. 易用

R

Page 21: How to Use the PowerPoint Template · 管理 元数据 数据质量管理 任务调度与管理 信息安全 信息生命周期 基础设施(服务器、存储、网络) 基础

Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |

OAA价值优势 集成Oracle数据库特性

企业分析应用与BI环境的无缝集成

启用广泛性预测分析

3. 企业级

R

Call Center Get Advice

Web Mobile

Branch Office

Social Media

Email

R

Page 22: How to Use the PowerPoint Template · 管理 元数据 数据质量管理 任务调度与管理 信息安全 信息生命周期 基础设施(服务器、存储、网络) 基础

Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |

R 引擎

Oracle

大数据机

客户端主机

R 引擎

Oracle R Connector for Hadoop 实现对 Hadoop 的本地 R 访问

MapReduce

节点

HDFS

ORCH

Hadoop

集群软件

ORCH 本地 R MapReduce 本地 R HDFS 访问

Oracle

数据库

R 引擎 ORE

ORE

Page 23: How to Use the PowerPoint Template · 管理 元数据 数据质量管理 任务调度与管理 信息安全 信息生命周期 基础设施(服务器、存储、网络) 基础

Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |

Oracle R Enterprise的优势 • 在数据库中运行模型

• 可处理大型数据集

• 发挥 Oracle Database 11g 和 Exadata 的强大能力

• 代码相同,而速度更快

• Oracle Advance Analytics

• 与OBIEE集成

• SAS与SPSS之外很好的选择

• 5300+可用的开源R packages

Page 24: How to Use the PowerPoint Template · 管理 元数据 数据质量管理 任务调度与管理 信息安全 信息生命周期 基础设施(服务器、存储、网络) 基础

Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |

Oracle NoSQL Database 领先的Key-Value数据存储引擎

性能优秀、架构开放

嵌入式数据库的领导者

多种NoSQL DB存储引擎首选

Java版本历经8+年商业化使用

基于Berkeley DB Java版本

Kay-Value键值对数据模型

智能的分布式处理架构

灵活的ACID策略

高可用,强性能

Page 25: How to Use the PowerPoint Template · 管理 元数据 数据质量管理 任务调度与管理 信息安全 信息生命周期 基础设施(服务器、存储、网络) 基础

Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |

Oracle NoSQL 数据库主要特性

• 简单数据模型 — 键值对(主键 + 次键模式)

• 简单操作 — 读取/插入/更新/删除

• 事务范围 — 主键内的记录、单一 API 调用

• 无序扫描所有数据(非事务)

简单数据模型

用户 ID

地址 订阅

电子邮件 ID 电话号码 到期日

主键:

次键:

值:

字符串

字节数组

Page 26: How to Use the PowerPoint Template · 管理 元数据 数据质量管理 任务调度与管理 信息安全 信息生命周期 基础设施(服务器、存储、网络) 基础

Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |

备份:每个节点快照 恢复:Load / Restore

集群间灾备 集群内冗余

商用级高可用

Page 27: How to Use the PowerPoint Template · 管理 元数据 数据质量管理 任务调度与管理 信息安全 信息生命周期 基础设施(服务器、存储、网络) 基础

Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |

Oracle云计算数据基础设施

甲骨文能力:完整的企业基础设施架构

海量管理能力 多结构 高可用 水平扩展 按需服务

并 行 架 构

企业应用

应用中间件云平台

ORACLE ExaLogic

(应用网格)

SOA 云服务支撑平台

集成SOA

流程管理BPM

安全性Identity

用户交互 Web

JAVA 开源

应用中间件

核心业务数据

大数据

海量,多结构 变化快,低密度 PB+ 级

多结构 非关系模型

结构化 关系模型

C-level

实时BI

OLTP 百TB+级

价值 数据 提练 上移

热点 数据 上移

•ODI For Hadoop •Oracle Hadoop Loader •Oracle NoSQL •Hadoop MapReduce

•混合列压缩 •智能扫描 •Flash Cache •RAC •Advanced Analytics

内存数据库 内存列压缩 Essbase in Memory OBIEE Foundation

Page 28: How to Use the PowerPoint Template · 管理 元数据 数据质量管理 任务调度与管理 信息安全 信息生命周期 基础设施(服务器、存储、网络) 基础

Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |

流 获取 组织 分析 决策

Oracle是数据库和信息管理行业的领导者。 Oracle提供的所有组件,你需要从你的大数据平台得到真正的结果

大道至简---软硬一体优化集成的Oracle大数据平台 加快端到端的解决方案上市时间和降低风险,简化IT,聚焦业务

InfiniBand InfiniBand Data Warehouse

In-D

ata

base

A

naly

tics

Oracle Advanced Analytics

Oracle Database

BIEE+

ESSBase

TimesTen

Endeca

Hadoop

Open Source R

Oracle NoSQL Database

OEP

Coherence

Big Data SQL

Page 29: How to Use the PowerPoint Template · 管理 元数据 数据质量管理 任务调度与管理 信息安全 信息生命周期 基础设施(服务器、存储、网络) 基础

Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Oracle Confidential – Internal 31