Upload
others
View
6
Download
0
Embed Size (px)
Citation preview
突破性进展优化和自动化新产品和新功能
“After decades of false starts, artificial intelligence is on the verge of a
breakthrough, with the latest progress propelled by machine learning.”McKinsey Global Institute, Artificial Intelligence The Next Digital Frontier? June 2017
人工智能引领新一轮创新浪潮
媒体与娱乐 个性化推荐健康与医疗 金融服务交易 客户体验
• 内容生成• 促销与市场活动• 版权保护• 内容分类与标签• 字幕自动生成• …
• 语音服务• 聊天机器人• 呼叫中心优化• 个人服务中心管理• …
• 在线电商• 产品推荐• 信用评级• 广告与搜索相关• 个性化• …
• 药物发现与探索• 医学影像自动识别• 辅助医疗• 自动诊疗• …
• 服务管理与推荐• 交易算法• 舆情与新闻分析• 潜在用户发现与推荐• …
人工智能与机器学习正在影响各行各业
亚马逊在人工智能领域的大量深度创新
商品智能推荐 机器人与物流仓储 新产品
亚马逊自从成立以来一直在人工智能和机器学习领域进行大量投入,并且把我们的
知识与能力与客户分享20171995
智慧呼叫中心供应链管理 无人值守商店
BuildFax使用Amazon ML帮助承保人避免损失
“Amazon Machine Learning democratizes the process of building predictive models. It’s easy and fast
to use and has machine-learning best practices encapsulated in the product, which lets us deliver
results significantly faster than in the past.
”BuildFax aggregates dispersed
building permit data from across
the United States and provides it
to other businesses, especially
insurance companies, and
economic analysts. The
company also tracks trends like
housing remodels and new
commercial construction.
- Joe Emison, Founder & Chief Technology Officer, BuildFax
• BuildFax’s 的核心客户是保险公司,他们在房屋产险方面花费大量的资金
• BuildFax最初使用邮政编码等基本信息进行建模,建模过程很复杂,准确度不高
• BuildFax 现在使用 Amazon Machine Learning服务提供房屋年龄,修缮费用的评估,使用房屋的综合信息
• 以前需要半年以上时间才能完成的建模工作现在在一个月内可以完成
AWS的产品推动人工智能的广泛应用
PollyLex Rekognition
深度学习框架机器学习平台Amazon AI/ML托管服务
更简单,更易用 更丰富的控制,更定制化的模型
这些解决方案由久经考验的、高度扩展的AWS的产品和服务所支撑
AWS
GreengrassAWS
IoTAWS
Lambda
Amazon EC2
(P2 and G2 GPUs)
Amazon
S3
Amazon
DynamoDBAmazon
Redshift
Amazon EC2
(CPUs)
Amazon EC2
(ENA)
Amazon ML
Spark & EMR
Kinesis
Batch
ECS
视觉Rekognition Image
Rekognition Video
语音Polly
Transcribe
语言Lex Translate
Comprehend
GPU
(P3)CPU FPGA 无服务器化容器化 边缘设备
更多服务敬请期待
Amazon
Machine
Learning
Amazon
SageMaker
AWS专注于把AI的知识和功能提供给所有用户
AWS Deep Learning AMIs
定制化
易用性
Mechanical
TurkAWS
DeepLens
Amazon ML Lab
很多企业在尝试机器学习无法释放商业潜力
头脑风暴 建模 传授
缺少ML 专家
充分利用亚马逊机器学习专家在几十年间积累的经验、形成的技术,如Amazon Echo, Amazon
Alexa, Prime Air 和 Amazon GoAmazon ML Lab
提供急需的机器学习经验
AI & ML
Amazon Transcribe
全托管和不断训练的自动语音识别 (ASR) 服务,可接收音频并自动生成准确的文字记录。
示例用例:• 呼叫中心• VOD字幕生成• 广播字幕生成• 录制会议
预览
AI & ML
Amazon Translate
全托管翻译服务,使用深度学习提供高质量、快速且价格合理的语言翻译服务。
预览
示例用例:• 多语言应用程序(支持中文)• 文本分析工作• 与其他AWS服务协作 (如Amazon Polly或
Amazon Transcribe)
AI & ML
Amazon Comprehend
全托管的自然语言处理 (NLP) 服务,使用深度学习智能发掘任何文本的内容。
它可以提取:• 命名实体 – 人群,地点,公司,产品,日期,人名• 关键短语 – 关键的描述性短语,例如美丽的、总是晴朗的• 语言 – 发布时支持英语和西班牙语• 情感 – 积极、消极或中立• 主题检测 – 从大量的文本文件中获取
AI & ML
Amazon Comprehend
全托管的自然语言处理 (NLP) 服务,使用深度学习智能发掘任何文本的内容。
示例用例:• 社交媒体分析• 个性化内容推荐• 电子邮件分析• 语义搜索• 知识管理/发现
Data Visualization &
Analysis
Business Problem –
ML problem framing Data Collection
Data Integration
Data Preparation &
Cleaning
Feature Engineering
Model Training &
Parameter Tuning
Model Evaluation
Are Business
Goals met?
Model Deployment
Monitoring &
Debugging
– Predictions
YesNo
Data
Augm
enta
tio
n
Fe
atu
re
Augm
enta
tio
n
Retraining
• 配置管理Notebook 环境
• 配置管理训练集群
• 编写数据接口
• 扩展机器学习算法导大数据集
• 多主机分布式机器学习训练算法
• 安全的模型制品
为什么我们打造Amazon SageMaker: 模型训练是没有差异化的繁重工作
一键训练机器学习,深度学习和自定义
算法
更加方便超参数优化训练
高度优化的机器学习 算法
部署不需要花费太多工程
大规模全托管
Build预先搭建
notebook实例
DeployTrain
Amazon SageMaker
Amazon ECR
Model Training (on EC2)
Model Hosting (on EC2)
Tra
inin
g d
ata
Model art
ifacts
Training code Helper code
Helper codeInference code
Gro
und T
ruth
Client application
Inference code
Training code
Inference requestInference
response
Inference Endpoint
Amazon SageMaker
AWS DeepLens: 开发人员的深度学习摄像头( L i m i t e d P r e v i e w )
• 完全可编程的视频摄像头
• 设备端优化的深度学习框架 Apache MXNet, Caffe, TensorFlow
• 教程,样例代码,示例,预制模型
• 和Amazon Sagemaker集成
AWS深度学习框架之选
可编程性
简化网络定义并使用您已经知道的语言
可移植性
有效利用内存,允许模型在各种设备和平台上运行
可扩展性
能够跨多个 GPU 和主机进行扩展,以快速开发复杂的大型模型
Apache MXNet
开放神经网络交换 (ONNX)
• 开发人员可以选择最适合他们需求的框架• 更多的客户可以利用 MXNet 的性能和可扩展性• MXNet 用户在各种移动和边缘设备上运行他们的模型(高通,华为,
英特尔和 ARM 宣布支持 ONNX)
最主流和前沿的GPU/FPGA深度学习加速器
通用GPU计算实例
图形GPU计算实例
P2NVIDIA
K80
G3NVIDIA
M60
G2NVIDIA
K520
FPGA计算实例F1Xilinx
UltraScale
+ VU9P
P3NVIDIA
VOLTA
云端的GPU致力于优化人工智能
更低的成本
• 只需按您的使用量付费• 获得更低的可变成本• 将资本投入变成可变投入
更多的灵活性
• 将开发人员调配资源耗费的时间从数周缩短到几分钟• 访问任意规模的资源, 并根据需要扩展或缩减• 在全世界的多个区域轻松部署您的应用程序
更高的性能
• 多达 8 个 Tesla V100 GPU,各配有 5120 个 CUDA 核心和640 个 Tensor 核心
• 最多1 petaflop混合精度, 125 teraflops单精度,和62 teraflops
双精度浮点运算性能• 支持通过 NVLink 进行对等 GPU 通信• 使用 Elastic Network Adapter 提供增强型联网,在一个置放
群组内实现高达 25Gbps 的聚合网络带宽
更好的扩展性
• 利用 Amazon EC2 基于 ENA 的增强联网进行扩展• 对于于分布式深度学习框架能够以近乎完美的效率实现
扩展
最多40,000个CUDA核心
Apache
MXNet
Python 3 Notebooks
& Examples
(以及其他)
最快捷的一键式深度学习部署工具
• 借助 AWS Deep Learning AMI (适用于 Amazon Linux 和 Ubuntu) 和 AWS Deep Learning CloudFormation 模板,您可以快速部署和运行各种规模的主要深度学习框架。
• AWS Deep Learning AMI 是 Amazon Web Services 提供的且由其提供技术支持,以便在 Amazon EC2 中使用。
• AWS Deep Learning AMI 不额外收费 – 您只需为存储和运行应用程序时所用的 AWS 资源支付相关费用即可。
分析存储
Glacier
S3
DynamoDB
RDS, Aurora
AWS 大数据服务概览
Data Pipeline & AWS Glue
CloudSearch
EMR EC2
Redshift
Machine
Learning
ElasticSearch
Database
Migration
QuickSight
Kinesis
Analytics
Kinesis
FirehoseSnowBall
Direct Connect
采集
Kinesis
Athena
Amazon S3
Data Lake
Amazon Kinesis
Streams & Firehose
AWS LambdaApache Storm on
EMR
Apache Flink
on EMR
Spark Streaming
on EMR
Hadoop / Spark
Streaming Analytics Tools
Amazon Redshift
Data WarehouseAmazon DynamoDB
NoSQL Database
Amazon
Elasticsearch Service
Relational Database
Amazon EMR
Amazon Aurora
Amazon Machine Learning
Predictive Analytics
Any Open Source Tool
of Choice on EC2Da
ta S
ou
rce
sData Science Sandbox
Visualization /
Reporting
Amazon Kinesis
Analytics
Serving Tier
Clusterless SQL Query
Amazon Athena
Tra
nsa
ctio
na
l D
ata
Amazon Glue
Clusterless ETL
Amazon ElastiCache
Redis
Deep Learning
GPU Instances