发布于: Aug 9, 2022
人工智能与内容提取的结合大大提高了我们的工作效率,以处理合约等文档资料为例。以往,处理合约及协议等文档资料是一项费时费力的任务。在传统意义上,对典型的合约签订工作流进行审计往往涉及合约条款的加载、阅读及提取等多个步骤,这往往需要耗费大量人工与劳力。
以往,Amazon Web Services Finance and Global Business Services(Amazon Web Services FGBS)每月也曾投入150多个人工处理这方面工作。在此期间,众多分析师需要将上百份合约一次性手动输入至Excel表格当中。
最近,专门负责分析合约协议的 Amazon Web Services FGBS 团队开发建立一条自动化工作流,借此高效处理传入文档。其目标非常简单——把专业财会资源从繁琐的日常劳作中解放出来,将更多精力投入到增值性财务分析当中。
最终,该团队构建了一套解决方案,能够在 1 分钟之内以高保真度与可靠的安全性持续解析并存储整个合同中的重要数据。现在,整个自动化流程每月只需要 1 位分析师工作30小时即可完成平台的维护与运行。处理时长缩短至之前的五分之一,生产效率得到显著提高。
整个应用由两项 Amazon Web Services 支持的机器学习(ML)托管服务实现,分别为 Amazon Textract(可高效实现文档内容提取)以及 Amazon Comprehend(可提供下游文本处理,负责提取关键术语)。
本文将介绍整套解决方案的基本架构,深入研究架构设计并简要探讨其中的设计取舍。
Amazon Web Services FGBS 团队在 Amazon Web Services 机器学习(ML)专业服务(ProServe)团队的帮助下,构建起一套自动化、持久且可扩展的合约处理平台。传入的合约数据被存储在 Amazon Simple Storage Service (Amazon S3) 数据湖当中。此解决方案使用 Amazon Textract 将合约转换为文本形式,而后使用 Amazon Comprehend 进行文本分析与术语提取。从合约中提取到的关键条款及其他元数据,将被存储在 Amazon DyanmoDB(一套可接收键-值与文档类型数据的数据库)当中。财会用户可以通过由 Amazon CloudFront 托管的自定义Web用户界面访问数据内容,并执行关键用户操作,例如错误检查、数据验证以及自定义术语输入等。此外,他们还可以由完全托管应用程序流服务 Amazon Appstream 管理的 Tableau 服务器生成结果报告。您还可以使用 Amazon Web Services CloudFormation 模板在 Amazon Web Services 生产环境中启动并托管这套端到端合约处理平台。