LightOn Lyra-FR 型号现已在亚马逊 SageMaker 上市

我们很高兴地宣布,LightOn Lyra-FR基础型号已向使用亚马逊SageMaker的客户推出。LightOn 是专门使用欧洲语言构建基础模型的领导者。Lyra-FR 是一种最先进的法语模型,可用于构建对话式 AI、文案写作工具、文本分类器、语义搜索等。你可以轻松地试用这个模型,然后将其与 亚马逊 S ageMaker JumpStart 一起使用。 JumpStart 是 SageMaker 的机器学习 (ML) 中心,除了提供内置算法和端到端解决方案模板外,还提供对基础模型的访问,以帮助您快速开始使用机器学习。

在这篇博客中,我们将演示如何在 SageMaker 中使用 Lyra-FR 模型。

基础模型

基础模型通常根据数十亿个参数进行训练,可适应各种用例。当今最知名的基础模型用于总结文章、创作数字艺术以及根据简单的文本说明生成代码。这些模型的训练成本很高,因此客户希望使用现有的预训练基础模型并根据需要对其进行微调,而不是自己训练这些模型。SageMaker 提供了精选的模型列表,您可以在 SageMaker 控制台上从中进行选择。您可以直接在 Web 界面上测试这些模型。当您想要大规模使用基础模型时,无需离开 SageMaker 即可使用模型提供商提供的预建笔记本电脑轻松使用。由于模型在 亚马逊云科技 上托管和部署,因此您可以放心,您的数据,无论是用于评估还是大规模使用模型,都不会与第三方共享。

Lyra-FR 是当今市场上最大的法语型号。它是一个100亿个参数模型,由LightOn训练并可供访问。Lyra-FR 在大型法语精选数据库上接受过训练,它能够编写类似人类的文本并解决诸如分类、问答和摘要之类的复杂任务。所有这些都是在保持合理的推理速度的同时,平均请求的推理速度在 1—2 秒范围内。你可以简单地用自然语言描述你想执行的任务,Lyra-FR 将生成与母语为法语的人一样的回应。Lyra-FR 仅需几行代码即可提供业务就绪型情报原语,例如可操控生成和文本分类。对于更具挑战性的任务,可以在 “几枪” 学习模式下提高性能,在提示符中提供几个输入输出示例。

在 SageMaker 上使用 Lyra-FR

我们将通过 3 个简单步骤向您介绍如何使用 Lyra-FR 模型:

  • 发现 — 在适用于 SageMaker 的 亚马逊云科技 管理控制台上查找 Lyra-FR 模型。
  • 测试 -使用 Web 界面测试模型。
  • 部署 -使用笔记本部署和测试模型的高级功能。

探索

为了便于发现像 Lyra-FR 这样的基础模型,我们将所有基础模型整合到一个地方。要查找 Lyra-FR 模型,请执行以下操作:

  1. 登录 适用于 Sage Mak er 的 亚马逊云科技 管理控制台
  2. 在左侧导航面板上,您应该看到一个名为 JumpStart 的部分,其 下方 有 基础模型 。如果您还没有访问权限,请申请访问此功能。
  3. 一旦您的账户被列入白名单,您将在右侧看到模特列表。在这里你可以找到 Lyra-FR 10B 模型。
  4. 单击 “ 查看模型 ” 将显示包含其他选项的完整模型卡。

测试

一个常见的用例是运行临时测试以确保模型满足您的需求。你可以直接从 SageMaker 控制台测试 Lyra-FR 模型。在此示例中,我们将使用一个简单的文本提示,要求模型生成一个以 “水彩” 或 “l'aquarelle” 为主题的法语文章创意列表。

  1. 从上一节显示的模型卡中,选择 试用模型 。这将打开一个带有测试界面的新选项卡。
  2. 在此界面上,提供您想要传递给模型的文本输入。你还可以使用右侧的滑块调整任何你想要的参数。满意后,选择 “ 生成文本 ” 。

请注意,基础模型及其输出来自模型提供商,亚马逊云科技 对其中的内容或准确性不承担任何责任。

部署

当你提供你希望模型提供的信息示例时,文本生成模型效果最好。这被称为少量学习。我们将使用 Lyra-FR 示例笔记本来演示此功能。示例笔记本介绍了如何在 SageMaker 上部署 Lyra-FR 模型、如何汇总和生成文本以及少量学习。

它还包括直接使用 JSON 或 Lyra Python SDK 发出推理请求的示例。Lyra Python SDK 负责格式化输入、调用端点和解压缩输出。每个端点都有一个类:创建、分析、选择、嵌入、比较和令牌化。请注意,此示例使用的是 ml.p4d.24xlarge 实例。如果您的 亚马逊云科技 账户的默认限额为 0,则需要请求提高此 GPU 实例的限制。

SageMaker 通过 SageMaker Studio 提供托管笔记本电脑体验。有关如何设置 SageMaker Studio 的详细信息,请参阅 亚马逊 S ageMaker 开发者指南 。 我们将在此演示中将这个 GitHub 存储库克隆到 SageMaker Studio 中,但该笔记本也可以在其他环境中运行。

让我们来看看如何运行笔记本:

  1. 从本博客文章的 “发现” 部分转到模型卡,然后选择 “ 查看笔记本 ” 。你应该会看到在 GitHub 中打开了一个带有 Lyra-FR 笔记本的新选项卡。
  2. 在 GitHub 中,选择 lightonmuse-sagemaker-sdk ;这将带你进入存储库。选择 代码 按钮并复制 HTTPS 网址。
  3. 打开 SageMaker Studio。选择 “ 克隆存储库 ”, 然后粘贴从上面复制的 URL。
  4. 使用左侧的文件浏览器导航到 Lyra-FR 笔记本。
  5. 这款笔记本可以端到端运行,无需额外输入,还可以清理其创建的资源。我们可以看看 “使用 Create 进行情感分析” 的示例。此示例使用 Lyra Python SDK,通过给模型讲授一些示例,说明哪些文本应分为正面(正面)、负面(负面)或混合(减弱),从而演示少量学习。
  6. 你可以看到,使用 Lyra Python SDK,你所要做的就是提供 SageMaker 端点的名称和输入。SDK 为您处理所有解析、格式化和设置。
  7. 运行此提示符会返回最后一条语句是正面的。

清理

测试完端点后,请务必删除 SageMaker 推理端点并删除模型以避免产生费用。

结论

在这篇文章中,我们向您展示了如何使用亚马逊 SageMaker 发现、测试和部署 Lyra-FR 模型。立即申请 在 SageMaker 中 试用基础模型 的权限,并告诉我们您的反馈!


作者简介

Iacopo Pol i 是LightOn的首席技术官,负责公司的战略技术选择,以构建超大型语言模型并将其提供给公众。他热衷于通过直观的界面实现机器学习的民主化。在业余时间,他喜欢寻找巴黎最好的餐厅。

Alan Tan Alan Tan 是 SageMaker 的高级产品经理,领导大型模型推理工作。他热衷于将机器学习应用于分析领域。工作之余,他喜欢户外活动。


*前述特定亚马逊云科技生成式人工智能相关的服务仅在亚马逊云科技海外区域可用,亚马逊云科技中国仅为帮助您发展海外业务和/或了解行业前沿技术选择推荐该服务。