使用熟悉的 SQL 命令创建、训练和部署机器学习(ML)模型
通过 Amazon Redshift ML,数据分析师和数据库开发人员可以在 Amazon Redshift 数据仓库中使用熟悉的 SQL 命令轻松创建、训练和应用机器学习模型。通过 Redshift ML,您可以充分利用 Amazon SageMaker,这是一项完全托管的机器学习服务,而无需学习新工具或语言。只需使用 SQL 语句利用 Redshift 数据创建和训练 Amazon SageMaker 机器学习模型,然后使用这些模型进行预测即可。例如,您可以使用 Redshift 中的客户保留数据来训练客户流失检测模型,然后将该模型应用于营销团队的控制面板,以便为面临客户流失风险的客户提供激励。通过 Redshift ML,可以将模型作为 Redshift 数据仓库中的 SQL 函数提供,以便您可以轻松地直接在查询和报告中应用。
无需具备 ML 经验
由于 Redshift ML 允许您使用标准 SQL,因此您可以轻松地对新用例进行数据分析。Redshift ML 提供了 Redshift 和 Amazon SageMaker 之间的简单、优化且安全的集成,并在 Redshift 集群中实现推理,从而使您能够在查询和应用程序中轻松使用由基于 ML 的模型生成的预测。无需管理单独的推理模型终端节点,并且训练数据通过加密进行端到端安全保护。
使用标准 SQL 在 Redshift 数据上应用 ML
首先,使用 Redshift 中的 CREATE MODEL SQL 命令,并将训练数据指定为表或 SELECT 语句。然后,Redshift ML 会在 Redshift 数据仓库中编译并导入训练过的模型,并准备一个可直接在 SQL 查询中使用的 SQL 推理函数。Redshift ML 会自动处理训练和部署模型所需的所有步骤。
使用 Amazon Redshift 进行预测分析
通过 Redshift ML,您可以直接在查询和报告中嵌入欺诈侦测、风险评分和客户流失预测等预测功能。使用 SQL 函数将 ML 模型应用于查询、报告和控制面板中的数据。例如,您可以定期对数据仓库中的新客户数据运行“客户流失”SQL 函数,以预测有流失风险的客户,并将此信息提供给销售和营销团队,以便他们能够采取先发制人的行动,例如向这些客户发送旨在保留他们的优惠信息。
自带模型(BYOD)
Redshift ML 支持使用 BYOM 进行本地或远程推理。您可以将在 Redshift 之外训练的模型与 Amazon SageMaker 一起使用,在 Amazon Redshift 中进行本地数据库内推理。您可以导入 SageMaker Autopilot 并指导 Amazon SageMaker 训练的模型进行本地推理。或者,您也可以调用部署在远程 SageMaker 终端节点中的远程自定义 ML 模型。您可以使用接受并返回文本或 CSV 以进行远程推理的任何 SageMaker ML 模型。
通过 Amazon SageMaker 在 Amazon Redshift 中进行预测分析
工作原理
客户成功案例
“Jobcase 在生产中采用了几个使用 Amazon Redshift 机器学习的模型。每个模型在几分钟内直接对我们的 Redshift 数据仓库执行数十亿次预测,而无需数据管道。通过 Redshift ML,我们已经改进了模型架构,这些改进后的架构可在多种不同的电子邮件模板类型中使收入和成员参与率提高 5-10%,而推理成本却没有增加。”
Mike Griffin,优化与分析执行副总裁 – Jobcase
“我们对新的 Amazon Redshift 机器学习功能感到非常兴奋。通常,我们的共同客户需要从 Amazon Redshift 中提取数据才能进行机器学习推理。既然这可以在 Amazon Redshift 内本地完成,我们看到了巨大的性能和生产力提高的潜力。我们期待帮助更多客户对他们的 Amazon Redshift 数据仓库中的数据使用机器学习,并通过此新功能加速已使用机器学习的客户的推理管道。”
Raghu Murthy,首席执行官 – Datacoral
“我们一直在寻找一个统一的平台,可以同时支持数据处理和机器学习模型训练/评分。Amazon Redshift 一直是我们处理大量客户交易数据的首选数据仓库,我们越来越多地利用 Amazon SageMaker 进行模型训练和评分。在此之前,我们必须在两个管道之间来回移动数据才能执行机器学习步骤,这非常耗时且容易出错。嵌入机器学习功能后,Amazon Redshift 成为了我们一直在寻找的统一平台,它将大大简化我们的机器学习管道。”
Srinivas Chilukuri,人工智能卓越中心负责人 – ZS Associates
“我们 Rackspace Technology 帮助公司提升他们的人工智能/机器学习运营效率。我们对新的 Amazon Redshift ML 功能感到十分兴奋,因为它将使我们的共同 Redshift 客户能够通过熟悉的 SQL 界面,更容易地在他们的 Redshift 上使用 ML。与 Amazon SageMaker 的无缝集成将使数据分析师能够以新的方式使用数据,并向更广泛的企业提供更多的洞察。”
Nihar Gupta,数据解决方案总经理 – Rackspace Technology
“Slalom 是一家专注于战略、技术和业务转型的现代化咨询公司。我们听客户说,他们希望拥有从数据中获得更多洞察的技能和工具。Amazon Redshift 是一种常用的云数据仓库,我们的许多客户都依靠它来为他们的分析提供支持。新的 Amazon Redshift 机器学习功能将使 SQL 用户在无需学习新技能的情况下,通过机器学习更轻松地从数据中获取新类型的洞察。”
Marcus Bearden,业务主管 – Slalom