BigQuery是一个PB级的快速分析数据库。为了达到这个性能级别,BigQuery完全在内存中执行查询。大多数数据库和数据处理系统都使用在磁盘和内存上运行的混合执行器来实现可伸缩性。同时,BigQuery的执行引擎构建简单且纯粹的内存操作符,并通过可伸缩的数据重新分区(或称"shuffle")实现PB级的分析。这篇文章详细介绍了BigQuery shuffle,以及它如何实现高性能,利用Google的petabit级网络技术(如Jupiter)执行内存中的查询。
本文地址: /shujuku/21607.html
版权声明:本文发布于收集站云 内容均来源于互联网 如有侵权联系删除