发布于: Sep 14, 2020
Amazon ParallelCluster 是一种完全支持和维护的开源集群管理工具,让科学家、研究人员和 IT 管理员可以在 亚马逊云科技云中轻松部署和管理高性能计算 (HPC) 集群。HPC 集群是紧密耦合的计算、存储和联网资源的集合,让客户能够运行大规模科学和工程设计工作负载。
最新版 ParallelCluster 的重要功能增强包括:
- 在 Slurm 中支持多种实例类型:用户现在可以在 ParallelCluster 中创建多个作业提交队列,并在每个队列中指定多种实例类型。在提交作业时,用户可以指定他们希望用于作业的实例类型,以及他们希望将作业提交到的队列,从而简化多阶段工作流,并能够在一个集群中运行多个具有不同需求的工作负载。
- 支持 Elastic File System:我们现在正式支持在 ParallelCluster 中将 Elastic File System (EFS) 作为网络文件系统使用,在集群的主节点和计算节点之间有一个共享目录。
- Slurm 电源管理插件:我们重新架构了与 Slurm 的集成,以便使用 Slurm 电源管理插件。这种集成可以在根据各个作业的要求扩展计算资源时提高集群的稳定性和精确性。
使用 Amazon ParallelCluster 无需额外付费,您只需为运行应用程序所需的 亚马逊云科技资源付费。Amazon ParallelCluster 通过 Python Package Index (PyPI) 发布。Amazon ParallelCluster 的源代码托管在 GitHub 中的 Amazon Web Services 存储库下,您可以在此处了解如何在 亚马逊云科技上启动自己的 HPC 集群。
如需更多详细信息,您可以在此处找到最新版 Amazon ParallelCluster 的完整发布说明。