Reservoir Sampling [蓄水池抽样算法]
Published: Feb. 07, 2024
本文介绍了蓄水池抽样算法[Reservoir Sampling]
本文介绍了蓄水池抽样算法[Reservoir Sampling]
This blog is based on the course (CMU Databases Systems / Fall 2019) provided by Prof. Andy Pavlo and the course notes.
本文记录了部署Spark的二进制代码的大致步骤,这里使用Spark-3.2.4版本的standalone mode
作为例子。
本文概要地介绍了DuckDB的Query Execution
本文重点记录一下DuckDB中最重要的概念之一Pipeline,以及具体在代码中如何实现的。
Reading notes about the paper “Query Suspend and Resume”.
DuckDB的Buffer Management的设计与实现参考了LeanStore[1],通过实现Pointer Swizzling
来尽可能的兼顾in-memory database的性能和更强的处理out-of-core场景的能力。
DuckDB中的Data Representation基本上由Val->Value->Vector->Data Chunk的结构实现。