将亚马逊 CloudWatch 警报与亚马逊 CloudWatch 指标见解集成

实时警报对于主动了解系统何时无法按预期运行或采取自动纠正措施非常重要。警报使您有时间在问题导致停机之前进行调查和修复。但是，您想要应用警报的系统和指标并不总是那么简单。当警报应用于单一资源的单一指标（例如 Amazon EC2 实例的 CPU 利用率）时，其配置很简单。在某些情况下，除了如此简单之外，您还需要设置警报，以便同时监控多个资源，而不必担心任何资源的生命周期。

Amazon CloudWatch 指标洞察是一款强大的高性能 SQL 查询引擎，用于查询指标。在这篇博客文章中，我们将演示如何使用新的亚马逊CloudW atch警报与CloudWatch Metrics Insights集成来根据查询创建警报，CloudWatch Metrics Insights允许使用单个警报监控多个资源。它为以前不容易配置的场景增加了警报功能。

关于 CloudWatch 指标见

借助 CloudWatch Metrics Insights，您可以轻松查询和分析指标，从而更好地了解基础设施和大规模应用程序的运行状况和性能。

虽然 Metrics Insights 附带标准 SQL 语言，但您也可以使用可视化查询生成器开始使用指标见解。查询生成器可帮助你在不知道 SQL 的情况下直观地构建查询。您可以直观地选择感兴趣的指标、命名空间和维度，控制台会根据选择自动构造 SQL 查询。

要开始使用 Metrics Insights，你可以按照文档使用指标洞察查询指标。

关于云观警报

当应用程序和基础设施指标超过静态或动态设定的阈值时，Amazon CloudWatch 警报用作提醒您或自动采取补救措施的手段。CloudWatch 警报可缩短检测、分类和诊断影响工作负载性能的问题的时间，从而帮助您提高基础设施监控效率。

要开始使用 CloudWatch 警报，你可以按照文档 “ 使用亚马逊 CloudWatch 警报” 进行操作。

常见用例

使用 Metrics Insights 查询创建的警报允许您同时监控多个资源。Metrics Insight 查询会自动包含与其定义相匹配的新资源。例如，您可以使用单个警报监控多个自动扩展组，而不必担心在向任何自动扩展组进行扩展操作时添加或删除实例。它消除了与创建和管理每个指标和每个资源的警报相关的无差别繁重工作。

您可以在此处找到 M etrics Insights 警报的一些示例查询、示例和用例。

我们的解决方案

我们将创建以下资源

2 个自动扩展组
使用 Metrics Insights 查询提醒

启动 EC2 实例

警报是根据指标创建的，因此我们必须有一些指标才能开始。在这篇博客中，我们将演示使用指标洞察查询创建 CloudWatch 警报，该查询可以包含多个 EC2 实例。例如，我们将部署 2 个自动扩展组，但在实际场景中，可能是数百个自动扩展组或单个实例。

使用使用启动模板创建 Auto Scaling 组来创建两个自动扩展组

使用指标洞察查询创建 CloudWatch 警报

我们将使用指标洞察查询演示 2 个警报。第一个警报将在所有 EC2 实例的平均 CPU 使用率超过 70% 时触发，第二个警报将在任何单个实例的 CPU 使用率超过 80% 时触发

在亚马逊云科技控制台中打开云观察。单击 CloudWatch 左侧 导航中 “指标 ” 下的 “ 所有指标

图 1。云监控控制台。

选择 “所有指标” 后，选择 “ 查询 ” 选项卡以显示 “ 指标见解” 查询生成器

图 2。指标见解查询生成器。

图 2 显示了当你直观地选择命名空间和维度时，控制台如何根据你的选择自动为你构造 SQL 查询。您可以随时使用查询编辑器键入原始 SQL 查询，以更详细地深入研究和查明问题。

对于第一个警报，将 命名空间 指定为 亚马逊云科技/EC2 ，然后选择每实例指标。在 “ 指标名称 ” 下，选择 AVG 函数，选择 CPU 利用率 ，然后单击 “运行”。

Building queries using Metrics Insights query builder

图 3。运行指标洞察查询。

除了 AVG 之外，还有其他函数，例如总和、计数、最小 值和最大值 ，可用于聚合指标。

Available aggregate functions for metrics

图 4。聚合函数。

单击 “ 运行 ” 后，您应该能够看到绘制的所有 EC2 实例的平均 CPU 使用率图表。点击 图表化指标。

Plotting graph using Metrics Insights query

图 5。使用指标见解查询绘制图表。

在 “ 图表化指标 ” 下，您可以通过单击 “ 详细信息 ” 下黄色突出显示的部分来查看完整的 SQL 查询。单击 “ 操作 ” 下的警报图标（以橙色突出显示）以创建警报

图 6。绘制指标的图表。

接下来，在 创建警报 页面上，您可以配置指标评估 的时间段 和警报的阈值。为指标设置阈值后，页面上会显示一条代表阈值的红线。

图 7。创建警报。

图 8。指定警报条件。

您也可以单击 “ 查询 ” 并查看完整的查询。当查询很长且跨越多行时，这很有用。

Figure 9. Complete query on create alarm page.

图 9。在创建警报页面上完成查询。

在 “ 配置操作 ” 页面上，可以添加通知的 SNS 主题，然后单击 “下一步”

图 10。配置警报操作。

在下一页上，您可以为警报添加有意义的名称和描述。

Figure 11. Provide Alarm Name and Description.

图 11。提供警报名称和描述。

最后，选择 “ 下一步 ” 查看警报设置，然后单击 “ 创建警报 ” 以完成警报创建。
要为 “任何 CPU 使用率超过 80%” 创建第二个警报，您可以通过添加按实例 ID 分组和按最大值排序 () 函数 DESC（降序）来更改步骤 4 中使用的查询。此查询将返回每个实例的时间序列数据，按 CPU 使用率降序排序。

图 12。按查询运行分组。

单击 “ 运行 ” 后，您会注意到返回了多个时间序列，并且为每个实例绘制了一个单独的图形。

图 13。多个时间序列。

目前，多个时间序列不支持警报，因此您需要使用指标数学函数来获取单个时间序列。单击 “ 图表化指标 ” 选项卡。在 图形化指标 中，点击添加数学（以橙色突出显示）、 所有函数 ，然后选择 第一个 函数（以黄色突出显示）。此函数将返回所有时间序列数据中的第一个时间序列。

图 14。添加指标数学函数。

另请注意我们的指标洞察查询 q1 的标签（以蓝色突出显示）。我们将使用它来衡量数学的 FIRST 函数。

更新指标数学函数定义，然后单击 A pply 。

Figure 15. Metric math function to generate single time-series.

图 15。用于生成单个时间序列的度量数学函数。

取消选中 Metrics Insight 查询的复选框，然后点击指标数学函数旁边的警报图标。这将带您进入 创建警报 页面，在该页面中，您可以按照与以前相同的流程配置警报阈值，选择 SNS 主题，然后创建警报。

Figure 16. Creating alarm using metric math.

图 16。使用指标数学创建警报。

Figure 17. Specify conditions for alarm.

图 17。指定警报条件。

现在，您已经使用 Metrics Insights 查询创建了警报，它将自动包含单独部署甚至作为自动扩展组的一部分部署的任何新 EC2 实例的指标。

现在您已经安装了警报，您可以为实例生成负载并查看这些警报的运行情况。

警报后该怎么做

如果整个队列的平均 CPU 使用率突破阈值，您可以调查是否存在/存在任何特定的实例/实例导致该阈值。你可以使用指标洞察来获取这些信息。

如果单个实例的 CPU 使用率超过阈值，则可以使用 Metrics Insights 来识别实例 ID 并对其进行进一步的故障排除。识别实例 ID 的步骤也可以使用亚马逊云科技 Lambda 自动完成。

定价

标准的亚马逊 CloudWatch 定价将适用于使用 Metrics Insights 创建的警报。

清理

为避免您的账户产生费用，请删除您创建的资源。

删除 CloudWatch 警报：请参阅有关编辑或删除 CloudWatch 警报的文档
删除自动扩展组：请参阅 “ 删除您的自动扩展基础架构” 的文档

结论

这篇文章演示了如何利用 Metrics Insights 查询来创建动态警报，该警报可以同时监控多个资源，而无需对每个资源进行配置。

作者简介：

快速注册账号　畅享 40+ 免费云服务

跟随注册步骤详解，三分钟快速创建账号，领取免费权益 立即注册 »

1 进入注册页面
1. 打开中国区

账号注册页面

输入邮箱 - 邮箱验证

1. 打开中国区账号注册页面

输入邮箱 - 邮箱验证

立即开始注册立即开始注册

01

填写您

注册账号的邮箱

点击“继续”

01

填写您

注册账号的邮箱

点击“继续”

02

查看您的

注册账号邮箱

发件箱 no-reply@register.signin.amazonaws.com.cn

02

查看您的

注册账号邮箱

发件箱 no-reply@register.signin.amazonaws.com.cn

03

输入

邮箱中收到的验证码

点击“继续”

03

输入

邮箱中收到的验证码

点击“继续”

注：该链接中的内容显示语言是与您的网页浏览器设置相一致的，您可以根据需要自行调整语言栏。 *图片点击可放大
2 设置用户名及密码
2. 填写用户名密码

设置用户名 - 设置密码 - 确认密码

2. 填写用户名密码

设置用户名 - 设置密码 - 确认密码

立即开始注册立即开始注册

01

请设置您的

账号用户名

*例如: webchina

01

请设置您的

账号用户名

*例如: webchina

02

为您的帐号

设置密码

02

为您的帐号

设置密码

03

重新

输入密码

03

重新

输入密码

*图片可点击放大
3 填写企业信息
3. 填写账号联系人以及公司信息

3. 填写账号联系人以及公司信息

填写姓名 - 填写联系电话 - 填写公司名称 - 填写办公地址 - 选择是否需要发票 - 点击查看客户协议

填写姓名 - 填写联系电话 - 填写公司名称 - 填写办公地址 - 选择是否需要发票 - 点击查看客户协议

立即开始注册立即开始注册

01

填写公司联系人

姓名全称

01

填写公司联系人

姓名全称

02

填写公司联系人的

联系电话

02

填写公司联系人的

联系电话

03

填写

公司名称

*重要！！！公司名称请务必与您所提供的营业执照公司名称保持一致

03

填写

公司名称

*重要！！！公司名称请务必与您所提供的营业执照公司名称保持一致

04

填写

公司办公地址

省份/自治区/直辖市 - 城市 - 区 - 街道门牌号以及楼层信息 - 邮政编码

04

填写

公司办公地址

省份/自治区/直辖市 - 城市 - 区 - 街道门牌号以及楼层信息 - 邮政编码

05

请选择

是否需要发票

*附件-申请发票流程供您参考

05

请选择

是否需要发票

*附件-申请发票流程供您参考

06

您可以点击查看

客户协议

您可以点击查看客户协议勾选方框表示您已阅读，并同意客户协议的条款

06

您可以点击查看

客户协议

您可以点击查看客户协议勾选方框表示您已阅读，并同意客户协议的条款

*图片可点击放大
4 企业信息验证
4. 企业信息验证

上传企业执照 - 填写负责人姓名 - 填写联系方式 -上传身份证件

4. 企业信息验证

上传企业执照 - 填写负责人姓名 - 填写联系方式 -上传身份证件

立即开始注册立即开始注册

01

在此上传

企业注册执照

01

在此上传

企业注册执照

02

请填写网络安全负责人的

姓名

请注意：该字段务必与您下方提供的身份证号匹配或与证件上的姓名保持一致

02

请填写网络安全负责人的

姓名

请注意：该字段务必与您下方提供的身份证号匹配或与证件上的姓名保持一致

03

请填写网络安全负责人的

联系方式

有效的电子邮件地址 - 有效的中国内地手机号码 - 座机号码（如无座机，请填写正确有效的手机号码）

03

请填写网络安全负责人的

联系方式

有效的电子邮件地址 - 有效的中国内地手机号码 - 座机号码（如无座机，请填写正确有效的手机号码）

04

在此上传网络安全负责人的

身份证件

请注意：当您选择证件类型为“身份证”时，您需要填写正确的身份证号码，选择其他证件类型时，您需要上传证件扫描稿

04

在此上传网络安全负责人的

身份证件

请注意：当您选择证件类型为“身份证”时，您需要填写正确的身份证号码，选择其他证件类型时，您需要上传证件扫描稿

*图片可点击放大
5 完成手机验证
5. 完成手机验证

输入手机号 - 输入验证码

5. 完成手机验证

输入手机号 - 输入验证码

立即开始注册立即开始注册

01

在此填写

手机号

01

在此填写

手机号

02

请输入您收到的

4 位

验证码

02

请输入您收到的 4 位

验证码

03

请点击

继续

03

请点击

继续

*图片可点击放大
6 选择支持计划
6. 选择支持计划

选择一个亚马逊云科技支持计划

6. 选择支持计划

选择一个亚马逊云科技支持计划

立即开始注册立即开始注册

请根据需求

选择一个支持计划

请根据需求

选择一个支持计划

*图片点击可放大