发布于: Oct 28, 2024

Amazon EC2 宣布推出一种新的接口类型,将 Elastic Fabric Adapter(EFA)与弹性网络适配器(ENA)分离。EFA 提供高带宽、低延迟的网络,这对于扩展 AI/ML 工作负载至关重要。新的接口“仅限 EFA”允许您在辅助接口上创建独立的 EFA 设备。这样您就可以扩展计算集群以运行 AI/ML 应用程序,而不会占用私有 IPv4 地址空间或遇到与 Linux 关联的 IP 路由难题。

以前,每个 EFA 接口都与一个 ENA 设备耦合,后者使用一个 IP 地址。这可能会导致不断增长的 AI/ML 模型训练作业的扩展限制。当使用具有私有 IP 的多个接口时,Linux 还可能带来路由难题,例如由于源 IP 不匹配导致的数据包丢失以及主机名映射问题。仅限 EFA 的接口可以解决这些难题,因为 EFA 设备未分配 IP 地址,而是使用可扩展可靠数据报(SRD)协议,该协议在 MAC 地址上运行。仅限 EFA 的接口只能配置为辅助接口,主接口要么是与 ENA 耦合的 EFA,要么只是 ENA,因为 TCP/IP VPC 路由需要 ENA。

仅限 EFA 已在由光环新网运营的亚马逊云科技中国(北京)区域和由西云数据运营的亚马逊云科技中国(宁夏)区域中所有支持 EFA 的实例上推出。有关 EFA 的更多信息,请访问 EFA 文档页面