发布于: Nov 30, 2023
2023 亚马逊云科技 re:Invent 全球大会进入第三天,亚马逊云科技数据和人工智能副总裁 Swami Sivasubramanian 博士在周三的主题演讲中,为我们带来了关于亚马逊云科技生成式 AI 的最新能力、面向生成式 AI 时代的数据战略以及借助生成式 AI 应用提高生产效率的精彩分享,携手众多客户与合作伙伴,共话如何借助数据和生成式 AI 重塑业务、加速创新。Swami 博士在开场中指出:“当前我们处在另一个新技术的前沿。今天,人类和技术之间正展现出前所未有的紧密关系,生成式 AI 正以许多意想不到的方式提升人类的生产力。这种关系让人类与人工智能共同形成新的创新充满了无限可能性。”
Swami 博士介绍:“生成式 AI 有望成为我们这个时代最具变革性的技术。各行各业都在将生成式 AI 融入各自的业务,但没有一个大模型能够适合所有的场景。利用 Amazon Bedrock,客户可选择任何合适的模型来进行快速创新。” Amazon Bedrock 现已支持新推出的基础模型版本包括:Anthropic Claude 2.1、Meta Llama 2 70B 以及 Amazon Titan Family 等。
- 支持 Anthropic 最新 Claude 2.1 模型。提供了长达 200,000 个 token 的上下文窗口,并且提高了长文档的准确性。与上一代模型相比,Claude 2.1 在开放式对话中的错误陈述减少了 50%,同时单次调用的成本降低了 25%。
- 支持 Meta Llama 2700 亿参数模型。与早些支持的 Llama 2130 亿参数模型相同,这些模型在多个外部基准测试中的表现卓越,包括推理、编码、熟练程度和知识测试等,并在 Amazon Bedrock 上提供了极高的性价比组合。
除了第三方的模型外,Amazon Bedrock 也包含了亚马逊云科技自研的、最新升级的基础模型 Amazon Titan:
- 新增大语言模型 Amazon Titan Text Lite 与 Amazon Titan Text Express。除 Embedding 的模型外,亚马逊云科技还提供两款大语言模型 Amazon Titan Text Lite 和 Amazon Titan Text Express。Titan Text Lite 可执行对文本的总结、文案生成和微调;Titan Text Express 开放式文本生成、会话聊天,并支持 RAG(检索知识增强)。
- 新增 Amazon Titan Multimodal Embeddings 模型。帮助客户为最终用户提高多模态搜索和推荐体验,让输出结果更准确且与上下文相关。模型可以将图像和短文本转换为 Embedding 数字表示形式,使模型能够轻松理解语义以及数据之间的关系。最终用户可以使用图像和文本提示的任意组合进行搜索查询。
- 新增 Amazon Titan Image Generator 模型。为了兑现亚马逊云科技践行负责任的人工智能承诺,所有 Amazon Titan 生成的图像都包含不可见水印。通过建立严谨的识别 AI 生成图像的机制,来减少错误信息的传播,促进 AI 技术的安全、可靠和透明发展。亚马逊云科技是首批广泛发布内置隐形水印的模型提供商之一,这些水印集成到输出的图像中,并设计为“拒绝更改”。
为客户提供更多选择的同时,如何更好地匹配业务需求成为客户面临的新问题。为帮助客户高效评估、比较和选择最适合其应用场景和业务需求的基础模型为帮助客户更好的应用,Swami 博士介绍了最新的 Amazon Bedrock 模型评估与选择功能。
在 Amazon Bedrock 控制台中,客户可以选择他们想要针对给定任务(例如问答或内容摘要)进行比较的模型,如需自动评估,客户可以选择预定义的评估标准(例如准确性、鲁棒性和是否含有有害内容)并上传自己的测试数据集或从内置的公开数据集中进行选择。对于需要复杂判断的主观标准或细微内容,客户只需点击几下即可轻松设置基于人工的评估工作流程并生成报告。以便客户可以轻松了解模型在关键标准上的表现,并可以做出最佳权衡,从而快速选择最适合其应用场景的模型。
全新定制功能帮助客户更好地使用私有数据定制基础模型
Swami 博士强调,数据是构建差异化生成式 AI 应用的核心优势。对于企业而言,如何使用企业私有数据打造更懂您的业务、更懂客户的生成式 AI 应用至关重要。Amazon Bedrock 提供专门构建的全新功能,可帮助客户使用自己的数据,私密且安全地定制模型,以构建差异化的生成式 AI 驱动的应用。
- 针对 Amazon Titan Text Lite 和 Titan Text Express 基础模型的持续预训练支持:进一步借助企业最新的私有数据增强对基础模型的控制,让基础模型的输出更懂您的业务。
- Cohere Command、Meta Llama 2 和 Amazon Titan 模型现在可以在 Amazon Bedrock 上进行微调,并且即将推出对 Anthropic Claude 2.1 的支持:客户可使用带标签的数据集提高特定任务的模型准确性。此外,亚马逊云科技客户很快就能够利用自己的数据源微调 Anthropic Claude 2 的性能。
- Knowledge Base for Amazon Bedrock 正式可用,可以帮助客户借助 RAG 使用上下文和相关公司数据定制模型输出。Knowledge Base for Amazon Bedrock 可将模型安全地连接到公司内部数据源用于 RAG,以便为聊天机器人和问答系统等场景提供更准确、针对特定上下文的响应。Knowledge Base for Amazon Bedrock 支持多种向量数据库,包括 Amazon OpenSearch、Pinecone 和 Redis Enterprise Cloud 的向量引擎,Amazon Aurora 和 MongoDB 也即将推出。
- 借助 Amazon Bedrock Agents 功能,生成式 AI 应用程序助力更便捷高效地开发生成式 AI 应用。完全托管的 Amazon Bedrock 代理功能使生成式 AI 应用程序能够跨公司系统和数据源执行多步骤任务。借助适用于 Amazon Bedrock Agents,客户可以提升准确性,加速生成式 AI 应用程序的开发。
- 全新推出 Amazon SageMaker HyperPod 助力客户更轻松地构建、训练和部署生成式 AI 模型。Amazon SageMaker HyperPod 可以提供对按需 AI 训练集群的访问,开发人员可以通过点击式命令和相对简单的脚本组合来配置集群,这比手动配置基础架构要快得多。
Swami 博士提到:“数据是您的差异化能力,同时高质量的数据是生成式 AI 应用的基础,如果要获取高质量的数据,用户必须要构建强大的数据战略。生成式 AI 对数据战略提出了新的要求。”他以“全面的、集成的、受治理的”三个维度,开启了系列精彩功能发布:
全新发布的 Vector Engine for OpenSearch Serverless,能够带来更高效的搜索和流程处理。
同时,还发布了 Amazon DocumentDB 和 Amazon DynamoDB 新增支持向量检索功能,可以允许用户将多种数据存储在一起。
除此之外,Amazon MemoryDB for Redis 也新增支持向量检索,响应时间变得更快,每秒可以处理数万个查询。
Amazon S3 加持下的 OpenSearch Service zero-ETL integration,这个新集成的工具可以分析 S3 中的所有操作数据。
全新推出 Amazon Clean Rooms ML,它可以允许用户在不共享底层数据的情况下与业务伙伴共同使用机器学习模型。
生成式 AI 驱动的 Amazon Q 支持的数据管理
AI 改变生活和工作方式、提升效率,而生成式 AI 毫无疑问会进一步提升我们的生产力与工作效率。生成式 AI 驱动的 Amazon Q,可以帮助用户更好的管理数据,实现便捷、直观,更容易访问。
1. 发布 Amazon Q natural language SQL query in RedShift,可以帮助将自然语言转换为 SQL,并且在 RedShift 中做 SQL 查询;
2. 发布 Amazon Q data integration in Amazon Glue,允许用户使用自然语言实现数据集成。
最后,Swami 博士以爱因斯坦的名言作为结尾,“创造力就是看到别人见过的东西,思考别人没有想到的东西。” 数据、生成式 AI 及人的关系越来越紧密,将加快我们构建创新与差异化体验的节奏。在安全的地方利用您的数据构建生成式 AI,提升用户全面智慧体验,亚马逊云科技有帮助您构建智慧体验的所有服务能力。期待您在亚马逊云科技的全新创造!