Amazon Aurora Parallel Query 是 Amazon Aurora 数据库的一项功能,可针对您的当前数据提供更快的分析查询,而无需将数据复制到单独的系统中。它可以将查询速度提高多达两个数量级,同时保持核心事务工作负载的高吞吐量。虽然一些数据库可以并行处理一台或几台服务器中 CPU 之间的查询处理,但 Parallel Query 利用 Aurora 的独特架构向下推送和并行处理 Aurora 存储层中数千个 CPU 之间的查询处理。通过将分析查询处理卸载到 Aurora 存储层,Parallel Query 减少了与事务工作负载对网络、CPU 和缓冲池的争用。
功能
加速您的分析查询
在传统数据库中,直接在数据库上运行分析查询意味着接受较慢的查询性能并有可能面临降低事务工作负载速度的风险,即使在运行轻量级查询时也是如此。查询的运行时间从几分钟到几小时,具体取决于表和数据库服务器实例的大小。由于存储层可能必须将整个表传输到数据库服务器以进行处理,因此网络延迟也会降低查询速度。
借助 Parallel Query,可将查询处理向下推送到 Aurora 存储层。查询将获得大量的计算能力,并且需要通过网络传输的数据将大幅减少。同时,Aurora 数据库实例可以继续为事务服务,而且中断大大减少。这样,您就可以在同一个 Aurora 数据库中互不干扰地运行事务和分析工作负载,同时保持高性能。
查询新数据
许多分析工作负载既需要新数据又需要良好的查询性能。例如,网络监控、网络安全或欺诈检测等运营系统依赖于事务数据库提供的实时新数据,并且不能等待将其提取到分析系统。
通过在用于事务处理的同一数据库中运行查询,而不会降低事务性能,Amazon Aurora Parallel Query 可实现更智能的运营决策,无需使用额外的软件,也无需更改查询。
如何开始使用
Parallel Query 适用于兼容 MySQL 的 Amazon Aurora。使用很简单:只需在创建 Aurora 集群时启用 Parallel Query 即可。
Aurora 查询优化器根据预期的性能增益自动决定是否将 Parallel Query 用于每个特定查询。与其他 Aurora 查询一样,您只需支付实际使用的 I/O 的费用。