发布于: Oct 10, 2022
Amazon Rekognition 是一项基于机器学习技术的图像与视觉分析服务,可帮助用户识别图像及视频中的对象、人物、文本、场景及活动,并同步检测出是否存在不当内容。Amazon Rekognition 文本检测功能则能够从图像及视频中识别并提取出文本内容。例如,在图像共享与社交媒体应用中,我们可以使用图像内文本所包含的关键字实现图像索引以及可视化搜索。在媒体与娱乐类应用中,大家还可以根据屏幕上的文本,例如广告、新闻、体育赛事比分以及字幕等等,对视频内容进行分类。
以下截屏,展示了一个提取图像内文本的具体示例。
为此,REA 团队开发出一套图像合规性系统,可自动检测图像中存在的各类不合规情况并及时通知卖方。最初,他们在 Amazon Elastic Compute Cloud(Amazon EC2)上训练了自己的 ML 模型,检测商标与联系方式。但这套模型出现大量误报,特别是在联系方式细节检测方面表现不佳。为了进一步提高模型的准确率,他们需要在模型训练与优化方面投入大量精力。为了满足项目目标并以及时间要求,该团队需要一套易于实施的解决方案,为业务提供必要的准确率支持。
考虑到这一目标,他们决定扩展现有 ML 模型,并在工作流程中引入 Amazon Rekognition Text in Image,以此提高检测准确率并减少误报。他们还添加了更多业务规则,分解到自研模型和 Amazon Rekognition 的各种预测,从而实现决策自动化。
为了进一步优化推理基础设施的运营成本,REA 团队还采用一个基于事件驱动的架构来管理商标和联系方式检测模型中的推理引擎,这是利用 Amazon Web Services Lambda 来实现的。这种方式不仅提高了其基础设施资源的使用效率,也在满足业务目标的同时显著节约了运营成本。
相关文章