云存储购买自第三方云供应商(拥有并运营数据存储容量并采用按需付费模型通过 Internet 进行交付)。这些云存储供应商管理着容量、安全性和持久性,以使您的应用程序从世界各地都能访问数据。
应用程序通过传统存储协议或直接通过 API 访问云存储。许多供应商都提供各种补充服务,旨在帮助大规模收集、管理、保护和分析数据。
通过将数据存储在云中,IT 部门可以在以下三个方面实现转变:
- 总体拥有成本。 利用云存储,您无需购买硬件、预配置存储或将资本用于“偶发”场景。您可以根据需求添加或删除容量、快速更改性能和保留特性,并且只需为您实际使用的存储付费。系统甚至可以根据可审核的规则将访问频率较低的数据自动迁移到成本更低的层,从而实现规模经济效益。
- 部署时间。 当开发团队准备就绪时,基础设施不应降低其工作速度。利用云存储,IT 人员可以在需要时快速交付所需的确切存储量。这样一来,IT 人员能够集中精力解决复杂的应用程序问题,而无需管理存储系统。
- 信息管理。 在云中集中存储创造了一个有力的杠杆点,可以支持许多新的使用案例。通过使用云存储生命周期管理策略,您可以执行庞大的信息管理任务,包括自动分层或锁定数据以支持合规性要求。
云数据存储有三种类型:对象存储、文件存储和数据块存储。每种类型都有自己的优势和对应的使用案例:
- 对象存储 – 在云中开发的应用程序通常可以利用对象存储巨大的可扩展性和元数据特性。Amazon Simple Storage Service (S3) 等对象存储解决方案非常适合用于从头构建需要扩展和灵活性的现代应用程序;您还可以使用这些解决方案导入现有数据存储以进行分析、备份或存档。
- 文件存储 – 某些应用程序需要访问共享文件并需要文件系统。通常使用网络附加存储 (NAS) 服务器支持这种类型的存储。Amazon Elastic File System (EFS) 等文件存储解决方案非常适合大型内容存储库、开发环境、媒体存储或用户主目录等使用案例。
- 数据块存储 – 数据库或 ERP 系统等其他企业应用程序通常需要针对每个主机的专用低延迟存储。这种存储与直接连接存储 (DAS) 或存储区域网络 (SAN) 类似。Amazon Elastic Block Store (EBS) 等基于数据块的云存储解决方案使用各个虚拟服务器进行预配置,可提供高性能工作负载所需的超低延迟。
云存储的可用性、持久性和低成本优势可能对于企业所有者来说极具吸引力,但传统的 IT 职能部门所有者(如存储管理员、备份管理员、联网管理员、安全管理员和合规管理员)可能会对将大量数据传输到云中的实际情况有所担忧。Amazon Import/Export Snowball 云数据迁移服务解决了网络成本高、传输耗时较长和安全隐患方面的问题,可以简化将存储迁移到云中的过程。
将数据存储在云中可能会引起用户对法规和合规性的担忧,尤其是当相应数据已存储在合规的存储系统中时。Amazon Glacier 文件库锁定等云数据合规性控制旨在确保您可以通过使用可锁定的策略,针对具体的数据文件库轻松部署和实施合规性控制。您可以指定诸如“一次写入,多次读取”(WORM) 之类的控制,用于锁定相应数据以防止将来进行编辑。使用 Amazon CloudTrail 等审核日志产品有助于确保实现基于云的存储和存档系统的合规性和监管目标。
传统本地存储解决方案的成本、性能和可扩展性可能会出现不一致的情况,特别是在长期运行时。大数据项目需要大规模、经济实惠、高度可用且安全的存储池(通常称为“数据湖”)。
基于对象存储构建的数据湖以原始形式存储信息,并且包括允许选择性提取和用于分析的丰富元数据。基于云的数据湖对于各种类型的数据仓库、处理、大数据和分析引擎(如 Amazon Redshift、Amazon RDS、Amazon EMR 和 Amazon DynamoDB)发挥着举足轻重的作用,旨在帮助您以较短的时间完成后续项目,并提供更多的相关性。