使用无代码机器学习,使用 Amazon SageMaker Canvas 情感分析和文本分析模型从产品评论中获得见解

根据 Gartner 的数据 ,85%的软件购买者对在线评论的信任程度与个人推荐一样多。客户通过多种渠道提供有关他们购买的产品的反馈和评论,包括评论网站、供应商网站、销售电话、社交媒体等。跨多个渠道的客户评论量不断增加的问题在于,公司可能难以使用传统方法处理数据并从中得出有意义的见解。机器学习 (ML) 可以分析大量产品评论并识别所讨论的模式、情感和话题。利用这些信息,公司可以更好地了解客户偏好、痛点和满意度。他们还可以使用这些信息来改进产品和服务,确定趋势,并采取战略行动来推动业务增长。但是,对于缺乏资源的公司,例如机器学习从业人员、数据科学家或人工智能 (AI) 开发人员,实施机器学习可能是一项挑战。借助 亚马逊 SageMaker Canva s 的新功能,业务分析师现在可以使用机器学习从产品评论中获得见解。

SageMaker Canvas 专为业务分析师使用 亚马逊云科技 无代码 ML 对表格数据进行临时分析的功能需求而设计。SageMaker Canvas 是一项可视化的点击式服务,允许业务分析师生成准确的机器学习预测,而无需编写任何代码或需要 ML 专业知识。您可以使用模型以交互方式进行预测,也可以对批量数据集进行批量评分。SageMaker Canvas 提供完全托管的即用型 AI 模型和自定义模型解决方案。对于常见的 ML 用例,您可以使用现成的 AI 模型使用您的数据生成预测,而无需进行任何模型训练。对于特定于您的业务领域的机器学习用例,您可以使用自己的数据训练机器学习模型以进行自定义预测。

在这篇文章中,我们演示了如何使用即用型情感分析模型和自定义文本分析模型从产品评论中得出见解。在这个用例中,我们有一组综合的产品评论,我们想要分析这些评论以了解情绪,并按产品类型对评论进行分类,以便轻松绘制模式和趋势,帮助业务利益相关者做出更明智的决策。首先,我们描述了使用即用型情感分析模型确定评论情绪的步骤。然后,我们将引导您完成训练文本分析模型以按产品类型对评论进行分类的过程。接下来,我们将解释如何审查经过训练的模型的性能。最后,我们将解释如何使用经过训练的模型进行预测。

情感分析是一种自然语言处理 (NLP) 即用型模型,用于分析文本中的情感。情绪分析可以用于单行预测或批量预测。每行文本的预测情绪要么是积极的,要么是负面的,要么是混合的,要么是中性的。

文本分析允许您使用自定义模型将文本分为两个或更多类别。在这篇文章中,我们想根据产品类型对产品评论进行分类。要训练文本分析自定义模型,您只需在 CSV 文件中提供由文本和关联类别组成的数据集即可。该数据集至少需要两个类别和每个类别的 125 行文本。训练模型后,您可以查看模型的性能并在需要时重新训练模型,然后再将其用于预测。

先决条件

完成以下先决条件:

  1. 拥有 A WS 账户
  2. 设置 SageMaker 画布
  3. 下载 产品评论数据集 示例:
    • sample_product_reviews.csv — 包含 2,000 条综合产品评论,用于情感分析和文本分析预测。
    • sample_product_reviews_training.csv — 包含 600 条综合产品评论和三个产品类别,用于文本分析模型训练。

情绪分析

首先,您可以通过完成以下步骤使用情感分析来确定产品评论的观点。

  1. SageMaker 控制台 上 ,单击导航窗格中的 “ 画布 ”,然后单击 “ 打开画布 ” 打开 SageMaker Canvas 应用程序。
  2. 在导航窗格 中单击 即用型模型 ,然后单击 情绪 分析。
  3. 点击 批量预测 ,然后点击 创建数据集。
  4. 提供 数据集名称 并单击 “ 创建”。
  5. 单击 “从计算机中选择文件” 以导入 sample_product_reviews.csv 数据集。
  6. 单击 “ 创建数据集 ” 并查看数据。第一列包含评论,用于情感分析。第二列包含评论 ID,仅供参考。
  7. 单击 “ 创建数据集 ” 以完成数据上传过程。
  8. “选择用于预测的数据集” 视图中,选择 sample_product_reviews.csv , 然后单击 “ 生成预测”。
  9. 批量预测完成后,单击 “ 查看 ” 以查看预测。

Sentiment Analysis Steps

情绪和信心列分别提供情绪和信心分数。置信度分数是介于 0 到 100% 之间的统计值,它显示了正确预测情绪的概率。

  1. 单击 “ 下载 CSV ” 将结果下载 到您的计算机。

文本分析

在本节中,我们将介绍使用自定义模型进行文本分析的步骤:导入数据、训练模型然后进行预测。

导入数据

首先导入训练数据集。完成以下步骤:

  1. 即用型模型 页面上,单击 创建自定义 模型
  2. 型号名称 中 ,输入名称(例如, 产品评论分析 )。单击 “ 文本分析”, 然后单击 “ 创建”。
  3. 选择 选项卡上,单击 创建数据集 以导入 sample_product_reviews_training.csv 数据集。
  4. 提供 数据集名称 并单击 “ 创建”。
  5. 单击 “ 创建数据集 ” 并查看数据。训练数据集包含描述产品类别的第三列,目标列由三种产品组成:书籍、视频和音乐。
  6. 单击 “ 创建数据集 ” 以完成数据上传过程。
  7. 选择数据集 页面上,选择 sample_product_reviews_training.csv , 然后单击 选择数据集

Classification Steps

训练模型

接下来,您将配置模型以开始训练过程。

  1. 在 “ 构建 ” 选项卡上的 “ 目标” 列 下拉菜单上,单击 product_categor y 作为训练目标。
  2. 单击 product_review 作为来源。
  3. 单击 “ 快速构建 ” 开始模型训练。

有关快速构建和标准编译之间差异的更多信息,请参阅 构建自定义模型

模型训练完成后,您可以先查看模型的性能,然后再将其用于预测。

  1. 分析 选项卡上,将显示模型的置信度分数。置信度分数表示模型有多确定其预测是正确的。在 “ 概览 ” 选项卡上,查看每个类别的绩效。
  2. 单击 “ 评分 ” 查看模型精度见解。
  3. 单击 “ 高级指标 ” 可查看 混淆矩阵和 F1 分数

做出预测

要使用自定义模型进行预测,请完成以下步骤:

  1. 在 “ 预测 ” 选项卡上,单击 “ 批量预测 ” ,然后单击 “ 手动 ” 。
  2. 单击您之前用于情感分析的相同数据集 sample_product_reviews.csv ,然后单击 “ 生成预测”。
  3. 批量预测完成后,单击 “ 查看 ” 以查看预测。

对于自定义模型预测,SageMaker Canvas 需要一些时间来部署模型以供初始使用。如果模型闲置 15 分钟,SageMaker Canvas 会自动取消配置模型,以节省成本。

预测 (类别)和 置信 度 列分别提供预测的产品类别和置信度分数。

  1. 突出显示已完成的作业,选择三个点,然后单击 “ 下载 ” 将结果下载到您的计算机。

清理

在导航窗格 中单击 “ 注销 ” 以注销 SageMaker Canvas 应用程序,以停止消耗 Canvas 会话时间 并释放所有资源。

结论

在这篇文章中,我们演示了如何在没有机器学习专业知识的情况下使用 亚马逊 SageMaker Canva s 从产品评论中获得见解。首先,你使用了现成的情绪分析模型来确定产品评论的情绪。接下来,您使用文本分析通过快速构建过程训练自定义模型。最后,您使用经过训练的模型将产品评论分为产品类别。所有这些都无需编写一行代码。我们建议您使用标准构建过程重复文本分析过程,以比较模型结果和预测置信度。


作者简介

Gavin Satur 是亚马逊网络服务的首席解决方案架构师。他与企业客户合作构建战略性、架构精良的解决方案,并对自动化充满热情。工作之余,他喜欢与家人共度时光、打网球、烹饪和旅行。

Les Chan 是总部位于加利福尼亚州尔湾的亚马逊网络服务的高级解决方案架构师。Les 热衷于与企业客户合作,采用和实施技术解决方案,唯一的重点是推动客户业务成果。他的专长涵盖应用程序架构、DevOps、无服务器和机器学习。

Aaqib Bickiya 是总部位于南加州的亚马逊网络服务的解决方案架构师。他帮助零售领域的企业客户加速项目和实施新技术。Aaqib 的重点领域包括机器学习、无服务器、分析和通信服务


*前述特定亚马逊云科技生成式人工智能相关的服务仅在亚马逊云科技海外区域可用,亚马逊云科技中国仅为帮助您发展海外业务和/或了解行业前沿技术选择推荐该服务。