此亚马逊云科技解决方案有何用途?
数字资产盘活机器人是一个将机器学习应用于业务场景的解决方案,客户可以使用此解决方案中的机器人,对其上传至 Amazon Web Services(亚马逊云科技)云上的数字资产(例如,照片、PDF文档、视频等非结构化数据)进行知识标记。标记知识将有助于客户实现业务流程自动化。此解决方案利用 Amazon Simple Storage Service (Amazon S3)和Amazon Elastic Compute Cloud (Amazon EC2)的竞价型实例,使客户可以安全的、低成本的使用批处理机器人来标记数字资产。机器人将所识别出的信息存储在客户私有的Amazon S3 存储桶中来保证数据安全性,机器人将运行在EC2竞价型实例中来节省计算成本。此解决方案是一个开源框架,构建者可以通过创建自己的模型或机器人为本解决方案框架做出贡献。
亚马逊云科技解决方案概述
数字资产盘活机器人解决方案提供两个部分功能:模型离线的训练和机器人的使用。
模型离线的训练是指,在 Amazon SageMaker 上用开源数据集进行基于容器的机器学习模型训练,训练好的模型会被自动上传到 Amazon ECR 中。
机器人的使用是指,当用户发出任务请求后,机器人会自动生成任务列表并执行任务。机器人任务均运行在 Amazon Batch 控制的弹性计算平台上,计算资源为按需使用,执行完成后自行释放,并可以根据您的任务规模自动扩展,同时底层的计算实例为竞价型实例,可以更进一步节省运行的成本。
等待盘活的数字资产首先需要存储在Amazon S3上,之后您只需要向Amazon API Gateway发出REST请求,指定要处理的S3文件和要应用的机器人类型即可。具体流程如下:
- Amazon API Gateway 将请求转发到 Amazon Lambda。
- Amazon Lambda 函数递归取出S3中所有待处理的文件路径,并生成待处理文件列表。
- Amazon Lambda 函数将待处理文件列表存入 Amazon Elasticsearch Service (Amazon ES)。
- Amazon Lambda 函数启动 Amazon SageMaker 的推理终端节点。
- Amazon Lambda 函数通过 Amazon Step Functions 启动一个或者多个 Amazon Batch 任务。
- Amazon Batch 执行相应资产盘活任务,从 S3 桶中读取源文件,并调用 Sagemaker终端节点进行推理。推理结果会写入 Elasticsearch 索引,同时将识别结果写入您指定的S3路径。
本解决方案内建三个机器人,分别是:车型分类机器人,情感分析机器人,场景文字识别机器人。
- 车型分类机器人的构建基于图像分类方法,将输入车辆图像进行分类,识别出汽车生产厂商、汽车型号等信息。该机器人基于AutoML技术,利用AutoGluon在ResNet50基础上生成新的对汽车类别进行分类的图像分类模型。
- 情感分析机器人的构建基于自然语言处理方法,通过调优预训练的中文BERT模型,将输入中文文本分类为正面/负面评论。
- 场景文字识别机器人可以用来识别图片中的印刷体中文文本信息。该机器人使用两个模型来完成身份证识别任务,分别是CTPN和CRNN。图片经过CTPN后可以取出文字位置的坐标信息,之后,包含文字的每个子图被送入CRNN模型去识别图片中文字的内容,并将结果合并返回。
功能特性
易用性
本解决方案使用开源数据集构建预训练模型,让您快速来完成诸如车辆分类,情感分析以及场景文字识别等机器学习任务。 通过利用 Amazon ECS 及 Amazon SageMaker 和 Amazon Batch 等亚马逊云科技服务,您可以轻松启动、扩展和管理 资产盘活任务,同时您可以通过 Amazon Step Functions 控制台随时查看您的任务进度。
成本优化
本解决方案利用 Amazon EC2 竞价型实例分析数字化资产,竞价型实例可以为您提供亚马逊云科技大规模运行的优势。您可以在运行超大规模工作负载的同时节省大量成本,也可以通过运行并行任务来加快工作负载的处理速度。与按需实例的价格相比,使用竞价型实例最高可以享受 90% 的折扣。
开源及定制化
本解决方案所使用的模型都是开源的。每个模型的训练和推理都运行在预先打包的自定义镜像上, 用户可以使用Amazon Sagemaker或者其它Notebook托管服务来打开训练框架软件,并导入自己标注过的数据进行训练。并将训练后的结果导出到本解决方案的机器人框架中。部署的生产环境将使用二次训练后的模型进行推理,以更好地适应不同用户的需求。