Advanced Data Strutures

1-Intro

这里列一些常见的数据结构和实现.

每个数据结构分为 Abstract 和 Implementation. 举个例子, 优先队列其实是个抽象，你可以用有序数组，双向链表或者堆这个中具体的数据结构来实现 .

这里的所有内容来自下面的 github 和对应的书

Binary Heap: 最小堆和最大堆

完全二叉树, 一般用数组实现.

每个节点最多有2个子节点
堆树是完全二叉树而且是左对齐的
- 如果堆的高度为 H, 那么每个叶子节点要不在 H 要不是 H-1
- 左对齐, 意味着没有右子树大于其左边的兄弟
根是最大的

基本所有的语言都自带, 例如 Java 的 java.util.PriorityQueue ;

D-Array Heap

基于堆可以扩展为多路堆, 每个节点不一定只有一棵子树. D 代表每个节点带点最大子节点数目.

典型场景1 -TopK

典型场景2 - Dijkstra 最短路径

典型场景3 - Prim 计算无向连通图 G 的 MST 最小生成树算法

典型场景4 - Huffman 压缩算法.

核心问题: 如何选择 d-array 中 d 的大小

通过数学公式的证明:

但是真正还是要看数据的分布, 常见中, 二元往往不是最快，5元更少最快，一般是 3或者 4, 出于实现简单的话，二元其实就可以了

Using randomization to balance binary search trees.