人工智能产品的测试探索
人工智能的定义
• 大数据+机器学习
测试思路
• 数据测试
• 训练集与测试集对比
• 分层测试
ALPHAGO的养成
• 整理过去人类对弈的80万盘棋局
• 拿1的棋谱训练一只狗狗,能够预测人类下一步
• 拿2得到的狗狗,每天自己和自己下100万盘棋• 拿1和3的棋谱,再训练一只狗狗,就是AlphaGo
推测
• 人类棋局与机器棋局相差悬殊
• 数据差异导致预测偏差
数据测试
• 从小数据到大数据
• 从数据库到hadoop
• 从精确验证到异常警报
分层测试
• 数据引入(预处理)
• 数据处理(清洗,拆分,拼接)
• 特征工程
• 模型训练
• 模型上线
重要的测试场景
• 自学习
• 预估服务
• 性能测试与造数
自学习--数据自更新
自学习--模型自更新
选型
• Pyspark
• Hadoop 2.0(yarn)
预测服务
测试重点
• 高可用
• 负载均衡
• 弹性伸缩
性能测试
• 模型调研• 计算密集
• 数据分布与数据规模
• 模型上线• 访问密集
• 并发与数据量
造数
• 不同的量级
• 不同的数据类型
• 不同的数据分布
测试环境的挑战
• 任务执行时间长
• 产品版本多
• 缺乏合理的调度机制
容器化
• Docker
• Kubernetes
网络方案
• Overlay(跨节点通信)
• Ingress(7层路由)
• Node-port(端口映射)
THANK YOU
Recommended