Amazon Athena 是一种交互式查询服务,让您可以轻松使用标准 SQL 语言在 Amazon S3 中直接分析数据。只需在 亚马逊云科技 管理控制台中点击几下,客户便可以将 Athena 指向其存储在 S3 中的数据,并开始使用标准 SQL 运行临时查询并在几秒钟内获取结果。Athena 属于无服务器服务,因此不需要设置或管理基础设施,且客户仅需为他们运行的查询付费。您可以使用 Athena 处理日志、执行临时分析及运行交互式查询。Athena 可自动扩展以并行执行查询,因此,即使对于大型数据集和复杂的查询,也能快速获得结果。
无服务器。零基础设施。零管理。
Amazon Athena 属于无服务器服务,因此无需管理基础设施。您无需担心配置、软件更新、故障或随着您的数据集和用户人数增加而扩展基础设施。Athena 会为您自动处理所有这些工作,以便您可以专注于数据,而非基础设施。
轻松入门
要开始使用,请登录 Athena 控制台,使用控制台向导或输入 DDL 语句来定义您的架构,然后立即使用内置的查询编辑器开始查询。您还可以使用 Amazon Glue 自动抓取数据源以发现数据,并在 Data Catalog 中填充新表格和修改的表格及分区定义。结果几秒钟内便可显示在控制台中,并且会自动写入您在 S3 中选择的位置。您也可以将它们下载到您的桌面。使用 Athena,无需进行复杂的 ETL 作业来为分析准备您的数据。这便于任何具备 SQL 技能的人快速分析大规模数据集。
易于查询,只需使用标准 SQL
Amazon Athena 使用针对低延迟、数据临时分析优化的开源分布式 SQL 查询引擎 Presto。这意味着,您可以使用 ANSI SQL 对 Amazon S3 中存储的大型数据集运行查询,并完全支持大型联接、开窗函数和数组。Athena 支持各种不同的数据格式,如 CSV、JSON、ORC、Avro 或 Parquet。您也可以使用 Athena 的 JDBC 驱动程序从各种不同的 BI 工具连接到 Athena。
按查询付费
使用 Amazon Athena,您只需为您运行的查询付费。将根据每个查询扫描的数据量向您收费。您可以通过压缩、分区或将数据转换为列式格式实现显著的成本节省和性能提升,因为每一项操作都会减少 Athena 需要扫描以执行查询的数据量。
显著提升性能
使用 Amazon Athena,您不必担心需要管理或调整集群才能显著提升性能。Athena 针对 Amazon S3 的快速性能进行了优化。Athena 自动并行执行查询,因此即使在大型数据集上,您也能在几秒钟内获取查询结果。
可用性高且持久性强
Amazon Athena 具有高度可用性,可在多个设施中使用计算资源执行查询,如果某特定设施无法访问,则会自动适当地路由查询。Athena 使用 Amazon S3 作为其底层数据存储,从而使您的数据可用性高、持久性强。Amazon S3 提供耐用的基础设施存储重要数据,其设计旨在为对象提供 99.999999999% 的耐用性。您的数据将通过冗余方式存储在多个设施以及一个设施内的多个设备上。
安全
Amazon Athena 允许您使用 Amazon Identity and Access Management (IAM) 策略、访问控制列表 (ACL) 和 Amazon S3 存储桶策略控制对您数据的访问。通过 IAM 策略,您可以授予 IAM 用户对 S3 存储桶的细化控制权。通过控制对 S3 中数据的访问,您可以限制用户使用 Athena 查询数据。Athena 还允许您轻松查询 Amazon S3 中存储的加密数据,并将加密的结果写回您的 S3 存储桶中。服务器端加密和客户端加密均受支持。
集成化
Amazon Athena 与 Amazon Glue 集成,即开即用。使用 Amazon Glue Data Catalog,您将能够跨各种服务创建统一的元数据存储库,抓取数据源以发现数据并在您的 Data Catalog 中填充新表格和修改的表格以及分区定义,并维持架构版本控制。您还可以使用 Glue 的完全托管型 ETL 功能变换数据或将数据转换为列式格式,以优化查询性能并降低成本。了解更多关于 Amazon Glue 的信息。