Amazon Elastic MapReduce (Amazon EMR) 是一种 Web 服务,让您能够轻松快速并经济高效地处理大量数据。Amazon EMR 是行业领先的云大数据平台,用于使用 Apache Spark、Apache Hive、Apache HBase、Apache Flink、Apache Hudi 和 Presto 之类的开源工具处理海量数据。Amazon EMR 可自动执行预置容量和调整集群之类的耗时任务,从而使您能够轻松设置、运营和扩展您的大数据环境,并使用开源框架 Hadoop 在可调整大小的 Amazon EC2 实例集群中分发数据和处理任务。Amazon EMR 可用于各种应用程序中,包括日志分析、Web 索引、数据仓库、机器学习、财务分析、科学模拟和生物信息学。客户每年启动数以百万的 Amazon EMR 集群。
Amazon Elastic MapReduce (Amazon EMR) 是一种 Web 服务,让您能够轻松快速并经济高效地处理大量数据。Amazon EMR 是行业领先的云大数据平台,用于使用 Apache Spark、Apache Hive、Apache HBase、Apache Flink、Apache Hudi 和 Presto 之类的开源工具处理海量数据。Amazon EMR 可自动执行预置容量和调整集群之类的耗时任务,从而使您能够轻松设置、运营和扩展您的大数据环境,并使用开源框架 Hadoop 在可调整大小的 Amazon EC2 实例集群中分发数据和处理任务。Amazon EMR 可用于各种应用程序中,包括日志分析、Web 索引、数据仓库、机器学习、财务分析、科学模拟和生物信息学。客户每年启动数以百万的 Amazon EMR 集群。
优势
简单易用
成本低廉
EMR 定价简单并且可预测:您需要按照每秒使用的每个实例费率付费,最低收费时长为 1 分钟。每小时只需 0.187 USD 即可启动 10 个节点的 EMR 集群。您可以通过为临时工作负载选择 Amazon EC2 Spot 实例并为长时间运行的工作负载选择预留实例来节省实例成本。
弹性
可靠
安全
EMR 将会自动配置 EC2 防火墙设置,以控制实例的网络访问权限,并在 Amazon Virtual Private Cloud (VPC) 中启动集群。 服务器端加密或客户端加密可与 Amazon Key Management Service 或您自己的客户管理的密钥搭配使用。EMR 使您能够轻松启用其他加密选项,如传输中和静态加密,以及通过 Kerberos 进行强身份验证。您可以使用 Amazon Lake Formation 或 Apache Ranger 对数据库、表和列应用精细数据访问控制。
灵活
优势
简单易用
成本低廉
EMR 定价简单并且可预测:您需要按照每秒使用的每个实例费率付费,最低收费时长为 1 分钟。每小时只需 0.187 USD 即可启动 10 个节点的 EMR 集群。您可以通过为临时工作负载选择 Amazon EC2 Spot 实例并为长时间运行的工作负载选择预留实例来节省实例成本。
弹性
可靠
安全
EMR 将会自动配置 EC2 防火墙设置,以控制实例的网络访问权限,并在 Amazon Virtual Private Cloud (VPC) 中启动集群。 服务器端加密或客户端加密可与 Amazon Key Management Service 或您自己的客户管理的密钥搭配使用。EMR 使您能够轻松启用其他加密选项,如传输中和静态加密,以及通过 Kerberos 进行强身份验证。您可以使用 Amazon Lake Formation 或 Apache Ranger 对数据库、表和列应用精细数据访问控制。
灵活
使用场景
提取、转换、加载 (ETL)
点击流分析
机器学习
实时流式传输
基因组学
使用场景
提取、转换、加载 (ETL)
点击流分析
机器学习
使用 EMR 的内置机器学习工具,包括 Apache Spark MLlib、TensorFlow 和 Apache MXNet,实施可扩展机器学习算法,并使用自定义 AMI 和引导操作轻松添加您的首选库和工具,以创建您自己的预测分析工具集。
实时流式传输
使用 Apache Spark Streaming 和 Apache Flink 实时分析 Apache Kafka、Amazon Kinesis 或其他流式传输数据源中的事件,以便在 EMR 上创建长期运行、高度可用且容错的流式传输数据管道。
基因组学
EMR 可用于快速、高效地处理海量的基因组学数据和其他大型科学数据集。研究人员可以 Amazon Web Services 上免费托管的基因组学数据。