使用亚马逊 SageMaker Canvas 加快机器学习模型训练,快速实现价值的业务成果

机器学习 (ML) 可以通过高级分析帮助公司做出更好的业务决策。各行各业的公司都将机器学习应用于诸如预测客户流失、需求预测、信用评分、预测延迟发货和提高制造质量等用例。

在这篇博客文章中,我们将探讨 Amazon SageMaker Canvas 如何提供更快、更准确的模型训练时间,从而实现迭代原型设计和实验,从而加快生成更好预测所需的时间。

训练机器学习模型

SageMaker Canvas 提供了两种无需编写代码即可训练 ML 模型的方法:快速构建和标准构建。这两种方法都提供了经过全面训练的机器学习模型,包括表格数据的列影响,Quick build 侧重于速度和实验,而标准构建则提供最高的准确性。

使用这两种方法,SageMaker Canvas 都会预处理数据,选择正确的算法,探索和优化超参数空间,然后生成模型。该过程从用户那里抽象出来,在幕后完成,使用户可以专注于数据和结果,而不是模型训练的技术方面。

Housing Regression Build

缩短模型训练时间

以前,快速构建模型最多需要 20 分钟,而标准构建模型通常需要 4 个小时才能生成具有特征重要性的经过全面训练的模型。通过新的性能优化,您现在可以在不到 7 分钟的时间内获得快速构建模型,在不到 2 小时的时间内获得标准构建模型,具体取决于数据集的大小。我们通过对大小从 0.5 MB 到 100 MB 的不同数据集进行基准测试来估算这些数字。

在幕后,SageMaker Canvas 使用多种 AutoML 技术自动为您的数据构建最佳的机器学习模型。考虑到数据集的异构特征,很难事先知道哪种算法最适合特定的数据集。在返回给定数据集的最佳模型之前,SageMaker Canvas 中新引入的性能优化功能对不同的算法进行了多次试验,并在幕后训练了一系列模型。

所有这些试验中的配置是针对每个数据集并行运行的,以找到性能和延迟方面的最佳配置。配置测试包括 F1 分数和精度等客观指标,并调整算法超参数以生成这些指标的最佳分数。

改进和加快模型训练时间现在使您能够快速进行原型设计和实验,从而缩短使用 SageMaker Canvas 生成预测的价值实现时间。

Housing Regression Analyze

摘要

Amazon SageMaker Canvas 使您能够在不到 7 分钟的时间内获得经过全面训练的机器学习模型,并有助于对多个机器学习问题做出准确的预测。通过缩短模型训练时间,您可以专注于了解数据和分析数据的影响,从而实现有效的业务成果。

现在支持 SageMaker Canvas 的所有 亚马逊云科技 区域均提供此功能。 你可以在 SageMaker Canvas 产品页面 和文档中 了解更多信息。


作者简介

Ajjay Govindaram 是 AW S 的高级解决方案架构师。他与使用 AI/ML 解决复杂业务问题的战略客户合作。他的经验在于为中型到大规模 AI/ML 应用程序部署提供技术指导和设计协助。他的知识范围从应用程序架构到大数据、分析和机器学习。他喜欢边休息边听音乐、体验户外活动以及与亲人共度时光。

Meenakshisundaram Thandav arayan 是 亚马逊云科技 的高级人工智能/机器学习专家。他帮助高科技战略客户开启人工智能和机器学习之旅。他对数据驱动的人工智能充满热情。

Hariharan Suresh 是 亚马逊云科技 的高级解决方案架构师。他热衷于数据库、机器学习和设计创新解决方案。在加入 亚马逊云科技 之前,Hariharan 是一名产品架构师、核心银行业务实施专家和开发人员,并在 BFSI 组织工作了 11 年以上。除了科技之外,他还喜欢滑翔伞和骑自行车。


*前述特定亚马逊云科技生成式人工智能相关的服务仅在亚马逊云科技海外区域可用,亚马逊云科技中国仅为帮助您发展海外业务和/或了解行业前沿技术选择推荐该服务。