Download pdf - 人工智能产品的测试探索 - Huodongjia.com€¦ · • Hadoop 2.0（yarn ... chrom—node chrom—node . ingress ingress controler weave router O Node Overlayng weav router

人工智能产品的测试探索

人工智能的定义

• 大数据+机器学习

测试思路

• 数据测试

• 训练集与测试集对比

• 分层测试

ALPHAGO的养成

• 整理过去人类对弈的80万盘棋局

• 拿1的棋谱训练一只狗狗，能够预测人类下一步

• 拿2得到的狗狗，每天自己和自己下100万盘棋• 拿1和3的棋谱，再训练一只狗狗，就是AlphaGo

推测

• 人类棋局与机器棋局相差悬殊

• 数据差异导致预测偏差

数据测试

• 从小数据到大数据

• 从数据库到hadoop

• 从精确验证到异常警报

分层测试

• 数据引入(预处理)

• 数据处理(清洗,拆分,拼接)

• 特征工程

• 模型训练

• 模型上线

重要的测试场景

• 自学习

• 预估服务

• 性能测试与造数

自学习--数据自更新

自学习--模型自更新

选型

• Pyspark

• Hadoop 2.0（yarn）

预测服务

测试重点

• 高可用

• 负载均衡

• 弹性伸缩

性能测试

• 模型调研• 计算密集

• 数据分布与数据规模

• 模型上线• 访问密集

• 并发与数据量

造数

• 不同的量级

• 不同的数据类型

• 不同的数据分布

测试环境的挑战

• 任务执行时间长

• 产品版本多

• 缺乏合理的调度机制

容器化

• Docker

• Kubernetes

网络方案

• Overlay(跨节点通信)

• Ingress(7层路由)

• Node-port(端口映射)

THANK YOU