发布于: Mar 6, 2025
我们很高兴地宣布,通过 Amazon Lake Formation,为运行在 Amazon EMR on EKS 上的 Apache Spark 正式推出精细数据访问控制(FGAC)功能。借助此功能,您能够对来自 EMR on EKS Spark 作业的数据湖表,强制执行 Lake Formation 中定义的完整 FGAC 策略(数据库、表、列、行和单元格级)。我们还将通过 EMR on EKS for Spark 工作流程共享正式推出的 Glue Data Catalog 视图。
Lake Formation 允许您通过授权和撤销语句定义精细访问控制,类似于 RDBMS,从而简化数据湖的构建、保护和管理。现在,同样的 Lake Formation 规则适用于 EMR on EKS 上的 Hudi、Delta Lake 和 Iceberg 表格式的 Spark 作业,进一步简化了数据湖的安全和治理。
采用 EMR on EKS 的 Amazon Glue Data Catalog 视图允许客户从 Spark 作业创建视图,这些视图无需访问引用表即可从多个引擎进行查询。管理员可以使用 EMR on EKS Spark 作业提供的丰富 SQL 方言来控制底层数据访问权限。访问权限使用 Amazon Lake Formation 权限进行管理,包括命名资源授权、数据筛选条件和湖形成标签。所有请求都记录在 Amazon CloudTrail 中。
在提供 EMR on EKS 的所有区域,通过发布 EMR 7.7 版,推出 EMR on EKS 上 Apache Spark 批处理作业的精细访问控制。要开始使用,请参阅将 Amazon Lake Formation 与 Amazon EMR on EKS 结合使用。