数据结构和算法

完美二叉树、完全二叉树、完满二叉树

完美二叉树、完全二叉树、完满二叉树

平衡二叉树、B树、B+树、B*树基本概念

B树和B+树区别？

一颗m阶的B+树和m阶的B_树的差异在于：

有n棵子树的结点中含有n个关键字；(而B树是n棵子树有n-1个关键字)
所有的叶子结点中包含了全部关键字的信息，及指向含有这些关键字记录的指针，且叶子结点本身依关键字的大小自小而大的顺序链接。(而B树的叶子节点并没有包括全部需要查找的信息)
所有的非终端结点可以看成是索引部分，结点中仅含有其子树根结点中最大（或最小）关键字。 (而B树的非终节点也包含需要查找的有效信息)

为什么说B+树比B树更适合操作系统的文件索引和数据库索引？

B+-tree的磁盘读写代价更低 B+-tree的内部结点并没有指向关键字具体信息的指针。因此其内部结点相对B 树更小。如果把所有同一内部结点的关键字存放在同一盘块中，那么盘块所能容纳的关键字数量也越多。一次性读入内存中的需要查找的关键字也就越多。相对来说IO读写次数也就降低了。举个例子，假设磁盘中的一个盘块容纳16bytes，而一个关键字2bytes，一个关键字具体信息指针2bytes。一棵9阶B-tree(一个结点最多8个关键字)的内部结点需要2个盘快。而B+ 树内部结点只需要1个盘快。当需要把内部结点读入内存中的时候，B 树就比B+ 树多一次盘块查找时间(在磁盘中就是盘片旋转的时间)。也可以考虑直接将非叶子节点索引结构读入内存，速度快很多。
B+-tree的查询效率更加稳定由于非终结点并不是最终指向文件内容的结点，而只是叶子结点中关键字的索引。所以任何关键字的查找必须走一条从根结点到叶子结点的路。所有关键字查询的路径长度相同，导致每一个数据的查询效率相当。数据库索引采用B+树的主要原因是 B树在提高了磁盘IO性能的同时并没有解决元素遍历的效率低下的问题。正是为了解决这个问题，B+树应运而生。B+树只要遍历叶子节点就可以实现整棵树的遍历。而且在数据库中基于范围的查询是非常频繁的，而B树不支持这样的操作（或者说效率太低）。

100亿个整数，内存足够，如何找到中位数？内存不足，如何找到中位数？

参考答案

数据结构和算法

完美二叉树、完全二叉树、完满二叉树

平衡二叉树、B树、B+树、B*树基本概念

红黑树概念

二叉查找树，红黑树，AVL树，B/B+树，伸展树——优缺点及比较

AVL树，红黑树，B树，B+树，Trie树应用场景

B树和B+树区别？

为什么说B+树比B树更适合操作系统的文件索引和数据库索引？

100亿个整数，内存足够，如何找到中位数？内存不足，如何找到中位数？