4
产品简介 Intel® Manager for Hadoop* 软件 Intel® Manager for Hadoop* 软件 英特尔开启大数据智能时代 Hadoop* 的环境较为复杂,难以在简单的 概念验证试点之外部署。Intel Manager for Hadoop 软件管理器(Intel Manager)可以 简化 Hadoop 集群的设置、管理、安全保护 以及故障排除。借助这一功能强大且易于 使用的工具,IT 人员可以专注于从 Hadoop 环境获得最大业务价值,而不必担心集群 管理的问题。 全面的大数据分析解决方案 Intel Distribution for Apache Hadoop* 软件 Intel Distribution)为结构化、半结构化 或非结构化数据集提供了全面的解决方案, 包括大型数据集的采集、处理与分析。除 Apache Hadoop 框架和组件外,Intel Distribution 还带有 Intel Manager 以支持集 群的集中管理。 Hadoop 集群部署顺畅便捷 Intel Manager 可自动安装、配置和优化 Hadoop 框架内的节点,并提供 Web 控制 台以便按照需要更改配置。 安装:Intel Manager 将查找特定网络内的 服务器节点,并在选定服务器节点中安 Hadoop 软件。使用基于向导的界面, Hadoop 管理员可以跨所有节点部署 Hadoop 框架、分配角色至节点并优化各节点的配 置设置。 安装任务包括: 扫描特定网络内的服务器节点并安装 Hadoop 组件。 定义灵活的网络拓扑结构、机架设置和 自动副本放置方案。 分配角色至集群中的节点。 解决方案要点: 自动安装和配置 Hadoop* 软件 向导驱动型集群管理 全面的 Hadoop 环境监控和活动 记录 主动的集群健康检查 资源性能优化与调试 安全的认证与授权 Intel® Manager for Hadoop* 软件 部署、配置、监控、告警和安全 1. Intel Distribution for Apache Hadoop* 软件组件。 Sqoop 数据交换 Flume 日志采集器 ZooKeeper* 协调 Pig* 脚本编写 Hive* SQL 类查询 MapReduce 分布式处理框架 HDFS* Hadoop 分布式文件系统 HBase* 纵向存储

Intel® Manager for Hadoop* 软件 · PDF fileHadoop 软件管理器(Intel Manager ... 内存、网络、存储 Java* 虚拟机(JVM) 内存 ... 数据中心的基础

Embed Size (px)

Citation preview

Page 1: Intel® Manager for Hadoop* 软件 · PDF fileHadoop 软件管理器(Intel Manager ... 内存、网络、存储 Java* 虚拟机(JVM) 内存 ... 数据中心的基础

产品简介

Intel® Manager for Hadoop* 软件

Intel® Manager for Hadoop* 软件英特尔开启大数据智能时代

Hadoop* 的环境较为复杂,难以在简单的

概念验证试点之外部署。Intel Manager for

Hadoop 软件管理器(Intel Manager)可以

简化 Hadoop 集群的设置、管理、安全保护

以及故障排除。借助这一功能强大且易于

使用的工具,IT 人员可以专注于从 Hadoop

环境获得最大业务价值,而不必担心集群

管理的问题。

全面的大数据分析解决方案

Intel Distribution for Apache Hadoop* 软件

(Intel Distribution)为结构化、半结构化

或非结构化数据集提供了全面的解决方案,

包括大型数据集的采集、处理与分析。除

了 Apache Hadoop 框架和组件外,Intel

Distribution 还带有 Intel Manager 以支持集

群的集中管理。

Hadoop 集群部署顺畅便捷

Intel Manager 可自动安装、配置和优化

Hadoop 框架内的节点,并提供 Web 控制

台以便按照需要更改配置。

安装:Intel Manager 将查找特定网络内的

服务器节点,并在选定服务器节点中安

装 Hadoop 软件。使用基于向导的界面,

Hadoop 管理员可以跨所有节点部署 Hadoop

框架、分配角色至节点并优化各节点的配

置设置。

安装任务包括:

• 扫描特定网络内的服务器节点并安装

Hadoop 组件。

• 定义灵活的网络拓扑结构、机架设置和

自动副本放置方案。

• 分配角色至集群中的节点。

解决方案要点:

• 自动安装和配置 Hadoop* 软件

• 向导驱动型集群管理

• 全面的 Hadoop 环境监控和活动

记录

• 主动的集群健康检查

• 资源性能优化与调试

• 安全的认证与授权

Intel® Manager for Hadoop* 软件 部署、配置、监控、告警和安全

图 1. Intel Distribution for Apache Hadoop* 软件组件。

Sqoo

p 数

据交

换Fl

ume

日志

采集

ZooK

eepe

r*

协调

Pig* 脚本编写

Hive* SQL 类查询

MapReduce 分布式处理框架

HDFS* Hadoop 分布式文件系统

HBa

se*

纵向

存储

Page 2: Intel® Manager for Hadoop* 软件 · PDF fileHadoop 软件管理器(Intel Manager ... 内存、网络、存储 Java* 虚拟机(JVM) 内存 ... 数据中心的基础

• 使用节点硬件配置,智能地配置 Hadoop

集群节点以实现最佳性能。

• 按需向现有集群添加或移除节点。

集群配置:Intel Manager 通过以下方法优

化改变整个集群中的配置和分配:

• 通过用户友好型界面为个别服务器节

点或整个集群提供简单易用的配置编

辑功能。

• 向集群中的所有节点推送更新。

• 通过对具有相互依赖性参数和其它配置

错误的静态检验减少配置的更新失败。

• 提供配置建议以实现优化的性能。

全面的系统可见性

Intel Manager 通过全面的监控、管理和诊

断控制加强对集群的可见性。

健康状态监控:可配置的面板跟踪关键

处理、内存、网络及存储利用率指标,

其中包括:

• 集群最重要状态信息的默认视图:CPU、

内存、网络、存储 Java* 虚拟机(JVM)

内存、日志、任务等。

• 附加明细模板可提供全部或特定 Hadoop

集群组件状态的深层信息,例如,数据

节点、Hadoop 分布式文件系统(HDFS*

MapReduce 任务及 JVM。

• 交互图网格显示由 Ganglia PRDTool 存储

数据库管理子系统维护的历史数据。

• 完整系统图以包含一个或多个集群的网

格形式显示一个或多个数据中心的物理

拓扑结构。

事件和告警管理:Intel Manager 监控各种

类型的集群事件,其中包括:

• 高 CPU 利用率

• 内存使用和交换

• 网络使用

• HDFS 容量

• HBase* 压缩风暴

英特尔与 HADOOP* 框架

英特尔一直致力于推动开放源代码

软件的发展,包括 Apache Hadoop*

框架和相关项目的。英特尔 Hadoop*

发行版的主要贡献是使得开放源代

码社区和用户可以充分利用下一代

数据中心的基础硬件、存储和网络

技术。

图 2. 安装和配置新的集群。

2

Page 3: Intel® Manager for Hadoop* 软件 · PDF fileHadoop 软件管理器(Intel Manager ... 内存、网络、存储 Java* 虚拟机(JVM) 内存 ... 数据中心的基础

• 磁盘容量

• 磁盘 I/O 利用率

• 频繁的 JVM 垃圾回收(GC)

MapReduce 任务失败统计

系统管理员可通过组合多个标准来定义高

级事件,并在超出设定的阈值时发出告警。

根据配置和设置,告警将以电子邮件的方

式发出。

诊断和日志管理:Intel Manager 可提供集群

中每个节点日志的集中查看。管理员可以:

• 轻松读取和搜索记录。为了避免创建过

大的文件,日志可累积,然后分割并循

环记录。

• 通过记录关键事件、错误、或警告的告

警来监控主节点。

• 通过报错去监控 HDFS 和 Hbase 表的

完整性。

资源优化:Intel Manager 可监控性能指标

并显示利用率图表,以便轻松检测瓶颈。

管理员可以根据这些报告维护最佳性能并

决定是否应该通过添加设备来扩展集群,

或者通过调整现有硬件和软件参数来优化

现有集群。

Hadoop 环境的安全性

Intel Manager 使用 Kerberos 和内建访问控制

规则以支持安全认证和授权,其中包括:

• 通过用户和 Hadoop 集群间认证防范恶意

的用户伪装。

• 通过 Hadoop 集群节点认证防范用户篡改

成员资格。

• 特定 HDFS 文件或目录的许可控制。

• 针对 Hive* 元存储访问的用户认证。

• Hbase 和安全 HDFS 间的相互认证。

• 通过英特尔 Expressway 服务网关实现应

用编程接口(API)级别的安全性和数据

互操作性。

图 3. The Intel Manager for Hadoop* 控制面板。

3

Page 4: Intel® Manager for Hadoop* 软件 · PDF fileHadoop 软件管理器(Intel Manager ... 内存、网络、存储 Java* 虚拟机(JVM) 内存 ... 数据中心的基础

世界级的服务与培训

依靠 Apache Hadoop 框架管理数据的企业通常需要企业级别的支持服务来确保高性能、可靠性和可用性。作为 Apache Hadoop 发行

版全球提供商之一,英特尔向客户提供 24-7 全天候的支持服务和广泛的培训。此外还提供包括系统设计、部署、定制和调试在内

的附加服务。

支持的操作系统

操作系统 INTEL® DISTRIBUTION FOR APACHE HADOOP* 2.0 软件 INTEL DISTRIBUTION 3.X 软件

Linux* 操作系统 Red Hat* Enterprise Linux 6 操作系统、Oracle* Enterprise Linux 6 操作系统、CentOS 6

Red Hat Enterprise Linux 5 操作系统、Red Hat Enterprise Linux 6 操作系统、Oracle Enterprise Linux 6 操作系统、CentOS 5、CentOS 6、SUSE* Linux Enterprise Server 11、Debian* GNU/Linux 操作系统 5.0 操作系统、Ubuntu* Lucid 操作系统

虚拟化环境 VMware* 虚拟化软件 VMware 虚拟化软件

如欲了解 Intel Distribution for Apache Hadoop 软件和合作伙伴计划的更多信息,请访问 intel.cn/bigdata

英特尔联系方式: 电话:1-855-229-5580邮件:[email protected]

本文件中包含关于英特尔产品的信息。本文件不构成对任何知识产权的授权,包括明示的、暗示的,也无论是基于禁止反言的原则或其他。除英特尔产品销售的条款和条件规定的责任外,英特尔不承担任何其他责任。英特尔在此作出免责声明:本文件不构成英特尔关于其产品的使用和/或销售的任何明示或暗示的保证,包括不就其产品的(i)对某一特定用途的适用性、(ii)适销性以及(iii)对任何专利、版权或其他知识产权的侵害的承担任何责任或作出任何担保。“关键业务应用”指如果因英特尔产品发生故障,而可能直接或间接导致人身伤亡的应用。如果您因任何此类关键业务应用而购买或使用英特尔产品,那么您应当赔偿,并且保证英特尔及其子公司,承包商,关联公司及以上各公司的董事、高管和雇员免受损失,免受因此类关键业务应用引起的产品责任或人身伤亡而直接或间接产生的诉讼费用、损害赔偿以及合理的律师费用的请求,无论英特尔或其承包商在该英特尔产品或其零部件的设计、生产或者产品警示中是否存有过失。

英特尔有权随时更改产品的规格和描述而毋需发出通知。设计者不应信赖任何英特产品所不具有的特性,设计者亦不应信赖任何标有“保留权利”或“未定义”说明或特性描述。对此,英特尔保留将来对其进行定义的权利,同时,英特尔不应为因其日后更改该等说明或特性描述而产生的冲突和不相容承担任何责任。此处提供的信息可随时改变而毋需通知。请勿根据本文件提供的信息完成一项产品设计。

本文件所描述的产品可能包含使其与宣称的规格不符的设计缺陷或失误。这些缺陷或失误已收录于勘误表中,可索取获得。在发出订单之前,请联系当地的英特尔营业部或分销商以获取最新的产品规格。索取本文件中或英特尔的其他材料中提的、包含订单号的文件的复印件,可拨打 1-800-548-4725,或登陆 http://www.intel.com/design/literature.htm

英特尔公司 © 2012 年版权所有。所有权保留。英特尔和 Intel 标识是英特尔在美国和/或其他国家的商标。

* 其他的名称和品牌可能是其他所有者的资产。

Java 是 Oracle 和/或其附属公司的注册商标。           0812/RF/ME/PDF           请注意环保           327827-001