发布于: Oct 10, 2022

Amazon Rekognition 是一项基于机器学习技术的图像与视觉分析服务,可帮助用户识别图像及视频中的对象、人物、文本、场景及活动,并同步检测出是否存在不当内容。Amazon Rekognition 文本检测功能则能够从图像及视频中识别并提取出文本内容。例如,在图像共享与社交媒体应用中,我们可以使用图像内文本所包含的关键字实现图像索引以及可视化搜索。在媒体与娱乐类应用中,大家还可以根据屏幕上的文本,例如广告、新闻、体育赛事比分以及字幕等等,对视频内容进行分类。
以下截屏,展示了一个提取图像内文本的具体示例。

在本文中,我们将展示REA Group如何通过使用Amazon Rekognition Text in Image功能的DetectText API,为其房地产列表建立起自动化图像合规审查解决方案。
REA Group 是一家专门面向房地产与实业资产的跨国数字广告公司。该公司已经拥有 20 多年市场发展历史,业务遍布澳大利亚、马来西亚、香港、泰国、印度尼西亚、新加坡以及中国。REA Group 在亚洲的业务包括多个领先门户网站品牌,如 iproperty。com。my、squarefoot。com。hk、thinkofliving。com,同时在新加坡与印度尼西亚持有 99 Group 的大量股份。REA Group 还在印度持有 Move, Inc 与 PropTiger 公司的可观股份。他们主要为消费者提供房地产购买、出售与租赁服务,同时发布各类房产新闻、装修技巧以及生活方式层面的内容。每一天,都有数百万消费者访问 REA Group 网站。
REA Group 提供基于搜索的门户网站,房地产销售商通过该门户上传在售的房地产图片,从而向消费者提供广泛的可搜索选择。但 REA Group 发现,经销商上传的图像往往不符合使用条款要求。其中部分图片包含商标或联系方式,这可能导致潜在的客户流失问题。为此,他们曾建立起专门的审核小组,以人工方式处理图像中的不当内容。但由于每日图像上传量过大,增加的审核过程往往令房产资料的发布时间延后达数天之久。

为此,REA 团队开发出一套图像合规性系统,可自动检测图像中存在的各类不合规情况并及时通知卖方。最初,他们在 Amazon Elastic Compute Cloud(Amazon EC2)上训练了自己的 ML 模型,检测商标与联系方式。但这套模型出现大量误报,特别是在联系方式细节检测方面表现不佳。为了进一步提高模型的准确率,他们需要在模型训练与优化方面投入大量精力。为了满足项目目标并以及时间要求,该团队需要一套易于实施的解决方案,为业务提供必要的准确率支持。

考虑到这一目标,他们决定扩展现有 ML 模型,并在工作流程中引入 Amazon Rekognition Text in Image,以此提高检测准确率并减少误报。他们还添加了更多业务规则,分解到自研模型和 Amazon Rekognition 的各种预测,从而实现决策自动化。

为了进一步优化推理基础设施的运营成本,REA 团队还采用一个基于事件驱动的架构来管理商标和联系方式检测模型中的推理引擎,这是利用 Amazon Web Services Lambda 来实现的。这种方式不仅提高了其基础设施资源的使用效率,也在满足业务目标的同时显著节约了运营成本。

相关文章