发布于: Sep 15, 2023

2023 年,以基于 GPT 模型对话应用为代表的生成式 AI 浪潮席卷全球,引起企业广泛关注。自此,由生成式 AI 引导的企业变革序幕全面展开,企业向数智化转型迈出了坚实的一步。

西门子股份公司(以下简称“西门子”)是一家专注于工业、基础设施、交通和医疗领域的科技公司。从更高效节能的工厂、更具韧性的供应链、更智能的楼宇和电网,到更清洁、更舒适的交通以及先进的医疗系统,西门子致力于让科技有为,为客户创造价值。

出于企业战略考虑,在结合业务具体需求的前提下,西门子中国与亚马逊云科技合作开发了基于生成式人工智能技术的智能会话机器人“小禹”,在生成式 AI 领域迈出了可喜的一步。目前,西门子中国使用的亚马逊云科技服务包括:Amazon Elastic Kubernetes Service (Amazon EKS)Amazon Relational Database Service (Amazon RDS)Amazon LambdaAmazon Simple Storage Service (Amazon S3)Amazon OpenSearch ServiceAmazon ElastiCacheAmazon SageMaker 等。

作为一家拥有全球视野、独具未来前瞻思考的公司,西门子中国认为科技创新是企业韧性成长、保持领先的关键。因此,如何运用新兴科技更好地发掘数据价值,是西门子中国持续发力的方向。西门子中国大禹团队应用大数据技术、机器学习、云技术、低代码来组建数据分析系统,专注于创新领域,借助 AI 能力更好地发挥数据的价值。

在构建知识库的过程中,大禹团队通过调研认识到,长期以来企业内部资源的检索和调用都存在结构散乱、检索速度慢、交互不便等问题。由于横跨多个不同领域、涉及多个不同业务单元,如若以传统方式打造知识库,这些问题将一直是横亘在部门间的长久之痛。因此,大禹团队决定将大数据库和生成式 AI 应用于一个全新的“智能知识库”,从根本上提升知识库的可用性。

长期以来亚马逊云科技一直是西门子中国的重要合作伙伴,双方在多个项目上有着紧密合作,因此,西门子大禹团队决定再度与亚马逊云科技携手,在亚马逊云的技术支持下,开发这款为西门子中国量身打造的以人工智能生成的方式进行交互的智能聊天机器人。

由于公司体量庞大,智能数据库的构建需面向多个不同业务部门,势必涉及大量的业务数据和文本数据。因此,智能知识库的存储架构,成为亚马逊云科技设计智能知识库时的首要考虑。

亚马逊云科技认为,智能知识库的架构设计,实质上是大语言模型(LLM, Large Language Model)在知识检索领域如何得到充分利用的问题。以往要让 LLM 在特定领域发挥作用,通常依靠的方法是提示工程(Prompt Engineering),通过不断完善提问关键字,获得对大语言模型的深入理解。但提示工程在知识库这种相对具体的应用场合,效果不甚理想,对模型进行微调(Fine-tune)又可能导致成本过高。为此,亚马逊云科技决定采取检索增强生成 (RAG, Retrieval Augment Generation) 方式增强模型,使之具有来自存档知识源的增强上下文的模型架构。

通过深思熟虑,最终亚马逊云科技为大禹团队提供的,是一个智能知识库暨智能会话机器人的解决方案指南,其中包括预训练大语言模型,Amazon OpenSearch Service 的向量数据服务,以及相关系统集成等。该解决方案指南具备自然语言处理能力、知识库检索能力、甚至是以数据去训练大语言模型的能力,这些核心关键能力让解决方案指南能实现目标知识库约 80% 功能,西门子中国根据企业内部需求再做 20% 定制化开发,最终形成完整的解决方案。

整个解决方案指南中,最大的亮点在于 “RAG 架构 + 向量数据库” 设计:核心主体知识库以向量方式构建,能够存储超大规模的向量数据。通过对数据进行向量嵌入处理,跨部门、跨业务、跨场景的数据之间也能够进行关系考量。而 Amazon OpenSearch Service 的 k 近邻(kNN)插件为它提供了核心向量数据库功能,现在向量嵌入可以与单个混合请求中基于文本的关键字组合,查询时在几毫秒内就可获得数十亿向量的上下文相关响应。

另一方面,RAG 架构极大地拓展了大模型的可用性。普通情况下当知识库新增内容时,相应的大模型必须进行微调,甚至是重新训练。而 RAG 允许对新增部分使用相同的模型处理,无需调整模型。这就相当于知识库在不影响访问速度的前提下,拥有了近乎无限的可扩展性。由向量数据库保障的杰出性能,再加上 RAG 架构提供的无限潜力,这就是智能会话机器人 “小禹” 能够在用户以简单语言进行提问的前提下,快速反馈生成式回答的秘密。

并且,由于亚马逊云科技提供了包括向量数据库、生成式 AI 在内的一系列核心技术,整个解决方案指南完成度高达 80%,而 Amazon OpenSearch Service 的无服务器特性,让开发人员不需要管理集群或担心生产规模,可以快速推动部署。

Amazon SageMaker 也为架构的伸缩性以及大语言模型持续迭代提供了很大帮助。借助 SageMaker Endpoint 的弹性伸缩能力,系统可以自动按照负载调整用于实时推理的资源,保证访问需求的同时提升整体性价比。Amazon SageMaker 上提供了丰富的模型开发和训练工具,保证客户可以在云端轻松实现大语言模型的调优以及测试更多不同类型的开源模型。

最终大禹团队完成后续开发和整套系统的部署时间大大缩短,整体开发与部署仅用三个月就圆满完成。

“在亚马逊云科技的帮助下,我们仅仅用了三个月时间就上线了生成式 AI 对话机器人 “小禹”。通过定制增强亚马逊云科技所提供的以向量数据库服务和大语言模型为基础的知识库原型,在短期内实现了快速、精准的查询和回复。”

李朝明 西门子 IT 经理

西门子中国小禹基于亚马逊云科技的产品架构图

大模型对于很多企业用户而言都是新生事物,从接受、熟悉到使用大模型,往往是一个漫长的过程。亚马逊云科技不仅为企业客户提供充裕的多样化算力、以及包括向量数据服务在内的数据基础设施来满足和支撑大模型,更提供解决方案指南并与企业用户共同进行后续开发。这让客户无需再花费时间在重复性的基础建设上,从而能够在非常短的时间内把垂直的、定制化的企业解决方案落地并投入应用。这在人工智能高速发展,日新月异的今天,有重要的意义。

相对于传统机器人,“小禹” 智能会话机器人的回答内容不仅生成速度更快,其对搜索关键词的命中率也更高,整体使用体验远超传统机器人。

西门子中国专属智能知识库上线后,首周就有超过 4000 位内部用户参与使用,超过 12000 个问题被提出并解答。作为智能知识库,它不但解决了各业务部门之间需求相似、重复开发的问题,更以云上弹性资源和托管的 Amazon OpenSearch Service 、Amazon SageMaker 等服务节约了系统在运维和扩展方面的投入成本。后续西门子大禹团队仍将不断完善智能知识库与 “小禹” 智能会话机器人,与亚马逊云科技团队以 “联合创新” 模式合作,共同探讨产品所需要的功能和实现方法,打造更优秀的产品功能与体验。

未来,西门子中国将与亚马逊云科技在人工智能领域展开更为深度的合作,在数字孪生、工业元宇宙等多个方面进一步发挥人工智能的作用。此前亚马逊云科技的一些产品和功能已被运用到西门子中国成都灯塔工厂,用于废料分拣、产品自检等关键的生产制造环节。可以想像在将来,人工智能技术一定能够以多种多样的方式,发挥更大价值。

西门子股份公司是一家专注于工业、基础设施、交通和医疗领域的科技公司。从更高效节能的工厂、更具韧性的供应链、更智能的楼宇和电网,到更清洁、更舒适的交通以及先进的医疗系统,西门子致力于让科技有为,为客户创造价值。