实时编写和调试 Apache Spark 应用程序
Amazon EMR Notebooks 是基于 Jupyter 和 Jupyter-lab 笔记本的托管式环境,让用户可以对数据进行交互式分析与可视化,与同事协作,并使用 EMR 集群构建应用程序。EMR Notebooks 专为 Apache Spark 而量身设计。它支持 Spark Magic 内核,允许您在 EMR 集群上使用 PySpark、Spark SQL、Spark R 和 Scala 等语言远程运行查询和代码。
使用 EMR Notebooks 无需管理软件或实例。您可以将笔记本附加到现有集群,也可以直接从控制台预置新集群。您可以将多个笔记本附加到单个集群,分离笔记本并将它们重新附加到新集群。
EMR Notebooks 允许您:
- 直接从您的笔记本监控与调试 Spark 任务。
- 在运行的 EMR 集群上安装笔记本范围内的库
- 关联 Git 存储库和您的笔记本以控制版本,并简化代码协作和重复使用
- 使用 nbdime 实用工具来比较与合并两个笔记本
使用 EMR Notebooks 无需支付额外费用。您只需为附加到笔记本上的 EMR 集群付费。您可以轻松地直接从 EMR 控制台创建多个笔记本。按照此分步教程的说明以开始使用。
详细了解 Amazon EMR 定价
准备好开始构建了吗?
Amazon EMR 入门