本页面中描述的服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国区域的亚马逊云科技服务入门页面。中国区域的亚马逊云科技服务入门页面中,仅关于特定服务的“区域可用性”和“功能可用性和实现差异”的部分(但不包括其通过超链接援引的内容)构成您与光环新网或西云数据之间就您使用亚马逊云科技中国(北京)区域或亚马逊云科技中国(宁夏)区域服务达成的协议(“协议”)项下的“文档”的一部分,而该入门页面的其他内容不构成“协议”的任何部分。
Amazon Athena 文档
Amazon Athena是一种交互式查询服务,旨在使您能够轻松使用标准SQL直接分析Amazon S3中的数据。客户可将Athena指向Amazon S3中存储的数据,并开始使用标准SQL运行临时查询,并获得结果。Athena无服务器,因此您无需设置或管理任何基础设施。您可以使用Athena处理日志、执行临时分析及运行交互式查询。Athena旨在自动扩展以并行执行查询,因此,即使对于大型数据集和复杂的查询,也能快速获得结果。
无服务器
Amazon Athena属于无服务器服务,因此无需管理基础设施。您无需担心配置、软件更新、故障或随着您的数据集和用户人数增加而需要扩展基础设施。Athena旨在为您自动处理这些工作,以便您可以专注于数据,而非基础设施。
轻松入门
如需开始使用,请登录Athena控制台,使用控制台向导或输入DDL语句来定义您的架构,然后使用内置的查询编辑器开始查询。您还可以使用Amazon Glue自动抓取数据源以发现数据,并在Data Catalog中填充新表格和修改的表格及分区定义。结果将立即显示在控制台中,并且会自动写入您在S3中选择的位置。您也可以将它们下载到您的桌面。使用Athena,无需进行复杂的ETL作业来为您准备需要进行分析的数据。
易于查询,只需使用标准SQL
Amazon Athena使用针对低延迟、数据临时分析优化的开源分布式SQL查询引擎Presto。这意味着,您可以使用ANSI SQL对Amazon S3中存储的大型数据集运行查询,并全面支持大型联接、开窗函数和数组。Athena支持各种不同的数据格式,如 CSV、JSON、ORC、Avro或Parquet。您也可以使用Athena的JDBC驱动程序从各种不同的BI工具连接到Athena。
性能
使用Amazon Athena,您不必担心需要管理或调整集群才能显著提升性能。Athena 针对Amazon S3的快速性能进行了优化。Athena旨在自动并行执行查询,因此即使在大型数据集上,您也能更加快速获取查询结果。
高可用性且持久性强
Amazon Athena旨在具有高度可用性,能够使用分布在多个设施中的计算资源执行查询操作,并且如果某特定设施无法访问,则会自动适当地路由查询。Athena使用Amazon S3作为其底层数据存储,从而为您的数据具备高可用性和持久性而设计。您的数据将通过冗余方式存储在多个设施以及一个设施内的多个设备上。
安全
Amazon Athena旨在使您能够使用Amazon Identity and Access Management(IAM)策略、访问控制列表(ACL)和Amazon S3存储桶策略控制对您数据的访问。通过IAM策略,您可以授予IAM用户对S3存储桶的细化控制权。通过控制对S3中数据的访问,您可以限制用户使用Athena查询数据。Athena还允许您查询Amazon S3中存储的加密数据,并将加密的结果写回您的S3存储桶中。服务器端加密和客户端加密均受支持。
集成化
Amazon Athena为与Amazon Glue集成而设计。使用Amazon Glue Data Catalog,您将能够跨各种服务创建统一的元数据存储库,抓取数据源以发现数据并在您的Data Catalog中填充新表格和修改的表格以及分区定义,并维持架构版本控制。您还可以使用Glue 的完全托管型ETL功能变换数据或将数据转换为列式格式,以优化查询性能并降低成本。
联合查询
Athena允许用户跨关系、非关系、对象和自定义数据源运行SQL查询。您可以使用熟悉的SQL构造跨多个数据源联接数据以进行快速分析,并将结果存储在Amazon S3中以备随后使用。Athena使用在Amazon Lambda上运行的Athena数据源连接器执行联合查询。亚马逊云科技具有适用于Amazon DynamoDB、Apache HBase、Amazon DocumentDB、Amazon Redshift、Amazon CloudWatch、Amazon CloudWatch指标以及与JDBC兼容的关系数据库(例如MySQL和PostgreSQL)的开源数据源连接器。您可以使用这些连接器在Athena中运行联合SQL查询。此外,使用Athena Query Federation SDK,您可以与其他数据源构建连接。
机器学习
您可以在Athena SQL查询中调用SageMaker机器学习模型来运行推理。您能够在SQL查询中使用ML模型,这使得复杂的任务(例如异常检测、客户群分析和销售预测)变得像编写SQL查询一样简单。通过Athena,任何具有SQL经验的人都可以轻松运行部署在Amazon SageMaker上的ML模型。
其他信息
有关服务控制、安全特性及功能的其他信息,包括有关存储、检索、修改、限制和删除数据的信息,请参见https://docs.amazonaws.cn/。以上链接包含的信息不构成光环新网关于亚马逊云科技(北京区域)的客户协议或西云数据关于亚马逊云科技(宁夏区域)的客户协议的 “文档”的一部分,也不构成您与光环新网或西云数据之间就您使用亚马逊云科技中国区域服务达成的其他协议的任何部分。