优化短信交付和最佳实践指南

作者: 泰勒霍姆斯, 凯西·福雷斯特, 帕特里克·维克 |

如果您向用户发送重要的短信,包括一次性密码 (OTP)、预约提醒、紧急警报和营销消息,那么您就会知道可靠的交付是多么重要。短信已成为现代商业通信的支柱,这是有充分理由的。其无处不在的性质和高参与率使其成为吸引全球用户的首选渠道。

但问题是这样的。随着消息数量的增长以及您越来越依赖短信进行关键通信,您可能会注意到,并非每条消息都完全按计划交付。这在整个电信行业中是正常的。实际上,期望短信的送达率为 100%,就像期望每个航班都准时到达一样。考虑到全球电信网络和系统固有的复杂性,这根本不现实。这并不是任何特定的消息提供商所独有的。这是 SMS 交付本身的本质。别担心,你并不孤单。让我们深入了解为什么会发生这种情况,并向您展示如何制定适合您业务的坚如磐石的消息传递策略。

在这篇文章中,我们将探讨当你发送短信时实际发生的情况,分享超出基本交付收据的实用监控技术,并向你展示如何在消息架构中建立冗余性。最后,您将拥有使用亚马逊云科技最终用户消息优化消息传送操作的知识和工具。

了解短信交付的复杂性

你有没有想过当你点击发送关键的 OTP 消息或重要的客户提醒时会发生什么?你的信息之旅比你想象的要复杂。让我们分解一下。

在到达最终用户之前,您的信息将通过涉及多个运营商、系统和设备的网络生态系统开始。虽然这听起来可能令人望而生畏,但亚马逊云科技最终用户消息会持续努力优化和简化这些交付路径,并在消息传送生态系统中保持牢固的关系。
那么,是什么让 SMS 交付如此复杂呢?可以把它想象成航空旅行——即使有最好的航空公司和优秀的条件,各种因素也会影响航班是否准时到达。短信也是如此。

网络基础设施起着至关重要的作用。就像航班在不同的空域中航行一样,您的消息也会通过运营商网络到达目的地。亚马逊云科技最终用户消息积极参与短信提供商、运营商和监管机构的合作,以确保最新的合规性和优秀的交付性能。但是,就像空中交通管制可能需要重定向航班一样,消息路由并不总是那么简单。网络拥塞、运营商维护(计划内和计划外维护)、国家监管变更和手机网络可用性偶尔会影响消息路由。

运营商又增加了一层复杂性。每家航空公司都有自己的一套规则和政策——可以将它们视为不同的机场,有自己的具体规定。他们实施各种过滤和反垃圾邮件策略,以不同的方式处理邮件队列,如果检测到可疑模式或异常数量,偶尔可能会在不主动通知的情况下屏蔽邮件。这实际上是一件好事——它有助于保护用户免受欺诈,尽管它有时会影响合法消息。

然后是最终目的地——最终用户的设备。即使您的信息成功应对了网络和运营商的挑战,收件人的电话也可能处于关闭状态、覆盖范围较差的区域,或者只是存储空间不足。这类似于乘客因为车辆在前往机场的路上抛锚而错过了航班。与乘客一样,短信连接可能会由于目的地的当地交通问题而中断。

这就是为什么只关注交付报告并不能说明全部情况的原因。例如,您可能会收到运营商的成功送达收据,但最终用户的手机可能处于飞行模式。或者相反,一条消息可能会在运营商报告中显示为未送达,但用户实际上是在稍有延迟后才收到的。

了解这些复杂性有助于解释为什么实现 100% 的交付率是不现实的。成功的消息传递策略不是追求完美的交付率,而是关注多个因素:

  • 建立全面的监控系统,
  • 遵循消息内容优秀实践(例如使用全球移动通信系统 (GSM) 角色,
  • 保持适当的消息长度,
  • 遵循 URL 优秀实践
  • 确保遵守承运人要求
  • 提供替代交付渠道。

接下来,我们将更深入地研究其中的一些问题,并探讨如何建立有效的监控措施,让您真正了解消息传送的成功。

送货率的现实

让我们来解决一个重要的问题:如果您预计短信的送达率为 100%,则需要调整这些预期,因为这不是该行业的现实。无论您使用哪个消息提供商,都是如此,这只是短信在全球电信网络中的运作方式的本质。即使在优秀条件下,各种因素也会影响交付:

  • 不同国家的网络状况
  • 运营商政策和过滤系统
  • 最终用户设备状态
  • 当地法规和要求
  • 自然或基础设施中断(例如:电缆切断、野火、海啸或其他环境事件)

可以这样想:即使是世界上最可靠的航空公司也无法保证每个航班都能准时到达。天气模式发生变化。机场面临拥堵。维护需求意外出现。短信交付可以应对类似的现实挑战。

重要的是了解您的特定用例的"好"是什么样子。就像 85% 的准时到达率对于冬季航班来说可能非常好,但在晴朗的天气下却低于平均水平一样,95% 的短信送达率在一个国家可能非常好,但在另一个国家却低于平均水平。这就是为什么为不同的区域和消息类型建立基准指标如此重要的原因。

可靠交付策略

既然我们明白了为什么 100% 交付是不现实的,那么让我们来谈谈最大限度地提高成功率的策略。

重试的艺术

当消息无法传递时,制定重试策略至关重要。但这并不像"试一试,再试一次"那么简单。你需要考虑以下方面:

  • 两次尝试之间要等待多长时间
  • 要重试多少次
  • 何时切换到其他频道
  • 重试策略的成本影响

可以把它想象成跟进一封重要的电子邮件——你不会每 5 分钟发送一封相同的电子邮件,但随着时间的推移,你可能会尝试不同的方法。

重要防滥用注意事项:请务必对重试功能设定合理的限制。这样可以防止有意和无意地滥用系统,确保所有用户的公平使用并维护服务的完整性。

这种重试策略只是实现可靠消息传送的综合方法的一部分。在这篇文章的后面,我们将探讨如何通过多渠道消息传递策略增强弹性,为你提供多条联系用户的途径。

建立有效的监测实践

让我们来谈谈真正重要的事情:知道你的消息是否真的传到了你的用户手中。当然,承运人送货收据很有用,但它们只是拼图的一部分。正如航空公司不仅仅依靠航班跟踪器来衡量成功率一样,你也需要更全面地了解自己的信息传送效果。

那么,如何获得全貌呢?首先要了解您的消息传递模式的"正常"是什么样子。

了解您的基准

就像您了解典型的网站流量模式或客户服务量一样,您需要了解典型的消息传送模式。与发往美国的邮件相比,发往印度的消息的正常送达率是多少?您的成功率在工作日和周末之间有何变化?在购物旺季呢?

这些基本知识将成为您的指南针——帮助您快速发现问题何时不太对劲。但是如何建立这种理解呢?这就是亚马逊云科技最终用户消息反馈 API 派上用场的地方。

让消息反馈 API 发挥作用

以下是承运人配送收据的问题:它们可能需要长达 72 小时才能到达,并且会因国家/地区而异。这就像等待三天才知道您的客户是否获得一次性密码一样!与其玩这个等待游戏,不如使用消息反馈 API 来实时了解消息传送情况。

假设你正在发送 OTP 代码。当用户成功输入他们的代码时,这是一个明确的信号,他们收到了你的消息。使用消息反馈 API,您可以记录此操作,将消息标记为已成功送达。这不仅可以为您提供即时反馈,而且还有助于更准确地了解您的实际交付成功率。

但是没有得到回复的消息呢?在没有用户互动一小时后,消息反馈 API 会将这些消息标记为失败。这可以帮助您保持准确的指标并快速识别潜在的交付问题。

制定完整的监控策略

您的监控策略应该像飞行运营中心一样,整合多个数据源,随时准备应对不断变化的情况。

消息反馈数据:这是您对用户互动的实时洞察。收件人是否完成了您的邮件本应触发的操作?是否使用了 OTP 代码?链接被点击了吗?

CloudWatch 指标:设置对您的业务有意义的警报。如果您的典型 OTP 转化率为 85%,则可能想知道它是否突然降至 80% 以下。请记住,这些不是完美的数字,也不是完美的数字。不同的消息可能需要不同的阈值。营销信息可接受的内容可能无法被安全验证码所接受。关键是了解您的正常交付率,并监控是否存在与该基准的重大偏差。有关为最终用户消息设置 CloudWatch 的更多信息,请参阅此处。

用户行为模式:注意用户如何与您的消息互动。某些类型的消息比其他类型的消息更成功吗?某些地区是否一直表现出不同的模式?这些信息是优化消息传递策略的黄金信息。

关键是要寻找模式。也许您的送达率在一天中的某些时间会下降,或者特定类型的消息的成功率较低。这些模式可以帮助您随着时间的推移调整和改善您的消息传递策略。

请记住,监控不仅仅是发现问题。这是关于了解您的消息传递生态系统并对其进行持续改进。当你发现问题时,你需要知道如何快速调查和解决问题。

调查和故障排除策略

即使有最好的监控系统,您偶尔也会遇到交付难题。正如航空公司有调查航班延误的程序一样,您需要采用系统的方法来快速调查和解决消息问题。

发现标志

就像空中交通管制员监控多个指标以发现潜在问题一样,您的消息传送系统也有关键指示器,这些指标会在需要注意时发出信号;最可靠的指标直接来自客户的体验:

  • OTP 转化率突然下降
  • 客户对丢失消息的投诉有所增加
  • 您的消息反馈数据中的异常模式
  • 配送尝试失败次数激增

客户驱动的信号是衡量消息健康状况的最准确指标。当这些指标发生重大变化时,尤其是在一次性密码 (OTP) 转化率和客户投诉方面,调查根本原因并了解其对用户体验的影响至关重要。

扮演侦探

当你发现有问题时,首先缩小范围。亚马逊云科技最终用户消息提供详细的事件数据,可帮助您调查交付问题。让我们来看看哪些信息触手可及:

消息事件包含重要的调查数据,例如:

  • 国家(ISOCountryCode):哪些国家受到影响?
  • 承运人信息(承运人名称):这是否特定于某些承运人?
  • 计时(事件时间戳):问题是否发生在特定时间?
  • 消息状态和描述:消息怎么了?
  • 消息类型和编码:内容格式可以成为一个因素吗?

在"最终用户消息"中要配置的一些最重要的内容是事件目的地。有关如何配置这些的深入文章,请阅读此处。以下是您可能收到的有助于描绘画面的交付事件的示例片段:

了解这些事件有助于识别模式。也许你最近更改了消息模板,或者你发送的邮件量可能比平时更高。这些可能是重要的调查线索。

何时致电 Amazon Support

调查短信问题时,时间至关重要。对于持续存在的问题,运营商需要最近的示例,最好是在过去 48 小时内发送的消息。这使他们能够调查当前的网络状况和消息流。

即使对于不再发生的历史问题,仍需要新的数据进行调查。如果您要报告过去的问题,请尝试提供最新的示例。请注意,如果问题过于陈旧,则由于日志保留政策和其他限制,提供商可能无法进行根本原因分析。

短信生态系统涉及多个第三方,每个第三方都在消息传送中发挥作用。调查问题通常需要与这些不同的实体进行协调,这可能会延长确定根本原因所需的时间。在某些情况下,如果问题已经过时了,则可能无法进行全面的分析。

及时举报是关键。您越早提醒我们出现问题,我们就越有可能收集相关数据并与承运人合作解决问题或提供有意义的见解。

如果您发现重大问题并拥有亚马逊云科技高级支持(提供额外帮助的付费服务),请随时与他们联系。但这是快速取得结果的关键:提供全面的信息。请记住,"我的消息未送达"与"我们在过去 4 小时内看到 X 国邮件的 OTP 转化率下降了 20%,影响了大约 1,000 条消息"那么有用。以下是需要调查的消息 ID。"

支持部门需要什么来帮助您:

  • 有短信问题的国家
  • 显示问题范围的清晰数据
  • 反映问题规模的多个消息 ID 和电话号码示例:
    • 对于影响数千条消息的广泛问题,请提供数十个示例
    • 对于区域问题,请举来自不同受影响地区的例子
    • 对于承运人特定的问题,请举例说明受影响承运人的情况
  • 问题开始的日期和时间以及你注意到的任何模式
  • 相关的消息反馈数据

受影响的下游承运人和我们的支持团队需要详细信息来帮助解决配送问题。如果你看到一个普遍存在的问题,那么几个示例数字是不够的。你的证据规模应该与问题的规模相匹配。

在没有高级支持的情况下调查问题

即使没有高级支持,您也可以使用强大的工具来调查和解决许多问题:

  • 利用 CloudWatch 指标:设置详细警报以尽早发现问题。监控交付率、用户参与度和错误类型的趋势。
  • 分析消息反馈数据:使用消息反馈 API 收集有关消息传送和用户互动的实时数据。这可以帮助您查明交付过程中的问题发生在哪里。
  • 查看亚马逊云科技最终用户消息文档:查看我们的优秀实践指南,了解您可以采取的积极措施。
  • 使用亚马逊云科技论坛和社区:联系可能遇到类似问题的其他亚马逊云科技用户。我们的社区论坛是分享经验和解决方案的好地方。
  • 实现日志:详细的应用程序日志对于追踪问题的根本原因非常宝贵。确保在消息传递工作流程中记录关键事件。
  • 使用模拟器号码进行测试:使用我们的模拟器号码在受控环境中测试您的消息传送流,帮助您隔离问题。

对于特别复杂或持续存在的问题,高级支持确实会提供额外的资源和专家协助。你可以在这里了解有关这些服务的更多信息:https://aws.amazon.com/premiumsupport/。

从每项调查中吸取教训

每项调查都是改善消息传递策略的机会。记录你学到了什么:

  • 哪些监控警报帮助您发现了问题?
  • 哪些调查步骤最有效?
  • 下次你怎么能更快地发现类似的问题?

但是,如果你能从一开始就防止其中一些问题呢?这就是建立弹性消息传递策略的用武之地,而这正是我们接下来要探讨的内容。

制定弹性消息传递策略

早些时候,我们讨论了重试逻辑如何帮助应对即时交付挑战。现在,让我们使用多渠道方法扩展我们的可靠性工具包...

正如乘客不必依赖一家航空公司来到达目的地一样,您也不应仅仅依靠短信进行关键通信。虽然短信很棒,但只使用一个频道就像取决于一条飞行路线。当该路径不可用时,您需要其他路径。

了解单点故障

需要考虑以下几点:专用短信电话号码由每个地区和国家的单一运营商合作伙伴提供。可以把它想象成依靠一家航空公司运营所有航线。如果该航空公司遇到问题,则需要其他路线。如果该承运人合作伙伴遇到问题,这可能会导致单点故障。

这使得在消息传送策略中实施冗余不仅有利/有益,而且对于关键业务通信至关重要。您可以通过以下方式创建这种冗余:

  • 使用多个渠道,如 WhatsApp、推送通知或语音通话
  • 将电子邮件通知作为备份、故障转移或仅作为处理特定类型消息的额外渠道来实现
  • 在同时支持专用号码和发件人 ID 的国家/地区,如果您的用例允许,计划使用任一选项
  • 如果特定的发起人遇到问题,使用电话池快速调整您的发送策略

请记住,正如主要机场维护多家航空公司和航线以确保可靠的旅行选择一样,您的消息传递策略也需要多条路径才能可靠地联系到您的用户。

多渠道优势

将您的消息传递策略视为为多家运营商提供服务的国际机场枢纽。亚马逊云科技最终用户消息为您提供了多个渠道供您使用:

  • 短信因其普及范围而广泛
  • WhatsApp 提供丰富的互动消息
  • 为应用程序用户推送通知
  • 当即时注意至关重要时进行语音通话
  • 电子邮件是另一种可靠的选择

但这不仅仅是拥有多个渠道,还要战略性地使用它们。为你传递的消息选择正确的渠道。并非每条消息都属于每个频道。

智能故障转移:您的消息安全网

想象一下你正在发送重要的安全警报。以下是智能故障转移策略的运作方式:

  1. 从短信开始——它既快速又可广泛访问
  2. 如果你在几分钟内没有得到确认,试试 WhatsApp
  3. 还是没有回应?如果他们有你的应用程序,请发送推送通知
  4. 对于真正重要的消息,你甚至可以升级为语音通话,或者同时通过电子邮件和短信发送

让用户坐在驾驶席上

正如飞行常客有首选的航空公司和航线一样,您的用户可能有首选的接收消息的方式。有些人可能希望在白天发送 WhatsApp 消息,但需要短信来发送紧急通知。其他人可能更喜欢在使用您的应用程序时推送通知,但使用短信发送重要警报。

让您的用户选择他们喜欢的频道,但要谨慎行事:

  • 让偏好更新变得简单明了
  • 应用首选项时要考虑消息的紧迫性
  • 请记住,偏好可能因消息类型而异

测试:您的安全检查

就像飞行员检查飞行前清单一样,定期测试您的消息设置。借助 SMS 模拟器号码,亚马逊云科技最终用户消息可以简化此操作——这是一款功能强大的工具,可让您在不通过运营商网络发送消息的情况下测试消息流。

使用模拟器编号,您可以:

  • 在受控环境中测试您的消息传送流
  • 接收真实的事件记录
  • 验证您的应用程序对 SMS 事件的处理
  • 所有这些都不会产生承运人费用(您仍将根据发送到的国家/地区支付运量),也不会影响生产流量

您的测试策略应包括:

  • 使用模拟器编号验证基本消息流
  • 检查消息是否在不同渠道上正确呈现(尤其是当您的消息支持多种语言时)
  • 确认您的重试逻辑按设计执行
  • 验证故障转移机制按预期运行
  • 监控每个频道的表现

可以将模拟器号码想象成您的消息测试实验室,这是一个受控的环境,在发送到真实电话号码之前,您可以在此环境中试验、验证和微调您的实现。您可以在亚马逊云科技最终用户消息文档中找到有关使用模拟器号码的更多详细信息。

目标:可靠的通信

请记住,目标不是完美的交付,而是与用户进行可靠的沟通。通过在系统中建立冗余并提供选择,您可以创建可应对现实挑战的强大消息传递策略。

正如航空公司维护多个枢纽和航线以确保可靠的服务一样,即使个别渠道面临挑战,您的消息传递策略也应提供可靠的沟通。

汇聚一堂:通往成功的消息传递之路

我们已经涵盖了很多领域,所以让我们总结一下大局。成功的消息传送并不是要达到完美的数字。它旨在构建一个强大的系统,即使条件不理想,也能可靠地将您与用户连接起来。

要吸取的关键教训

把我们学到的东西想象成你的消息传递策略工具包:

首先,我们发现了为什么短信发送不像按下按钮那样简单。就像飞行计划一样,您的消息在到达目的地之前会通过各种网络和系统导航。了解这些复杂性有助于设定切合实际的期望并指导更好的决策。

接下来,我们了解到全面监控就像拥有可靠的空中交通管制系统一样。这不仅仅是观看飞行追踪器。它旨在通过消息反馈 API 等工具积极监控乘客体验。请记住,知道您的乘客是否到达了最终目的地,这比简单的着陆确认所能告诉您的要多。

我们还探讨了如何在问题出现时识别和彻底调查问题。时间至关重要。在调查交付问题时,最初的 48 小时是黄金时间,而当您需要 Amazon Support 的帮助时,详细的证据是您的优秀资产。

最后,我们研究了通过多种渠道增强抵御能力。正如航空公司维护前往主要目的地的各种航线一样,您的消息传递策略也应在需要时准备好备用计划。

采取行动

准备好改善您的消息传递策略了吗?以下是您的下一步:

  1. 从监控开始
    查看您当前的监控设置。你只是在查看送货收据,还是在跟踪实际的用户互动?实施消息反馈 API 以更好地了解您的实际交付成功率。
  2. 设置智能警报
    配置对您的业务有意义的 CloudWatch 警报。请记住,不同的消息可能需要不同的阈值——营销信息可接受的内容可能无法被安全警报所接受。
  3. 建立您的安全网
    开始实施多渠道功能。你不需要同时做所有事情。从一个替代渠道开始,然后从那里扩展。单击此处参加有关短信和电子邮件之间基本故障转移的研讨会
  4. 测试和学习
    定期测试您的消息流并监控其性能。用你学到的知识不断完善你的策略。

需要更多帮助?

我们在这里为您的消息传递之旅提供支持。查看以下资源以更深入地了解:

  • 亚马逊云科技最终用户消息文档 [链接]
  • 消息反馈 API 指南 [链接]
  • 亚马逊云科技最终用户消息传递优秀实践 [链接]
  • 亚马逊云科技高级支持 [链接]

您的消息传递策略的未来

消息传送格局将继续发展,但我们讨论的基础知识将对您很有帮助:有效监控、彻底调查和建立冗余。借助亚马逊云科技最终用户消息,您的合作伙伴将持续努力优化消息传送并提供成功所需的工具。

请记住,目标不是完美。它正在构建一个可靠的通信系统,您的用户可以信赖。立即开始实施这些做法,这样您就可以顺利进行更有效的用户沟通。

你的下一步是什么?无论是实现消息反馈 API 还是设计多渠道策略,现在都是时候开始了。您的用户正在等待您的来信。



泰勒霍姆斯

泰勒霍姆斯

凯西·福雷斯特

凯西·福雷斯特

帕特里克·维克

帕特里克·维克


*前述特定亚马逊云科技生成式人工智能相关的服务仅在亚马逊云科技海外区域可用,亚马逊云科技中国仅为帮助您发展海外业务和/或了解行业前沿技术选择推荐该服务。