⼆叉搜索树的概念
⼆叉搜索树又称⼆叉排序树,它或者是⼀棵空树,或者是具有以下性质的⼆叉树:
• 若它的左子树不为空,则左子树上所有结点的值都小于等于根结点的值
• 若它的右子树不为空,则右子树上所有结点的值都大于等于根结点的值
• 它的左右子树也分别为⼆叉搜索树
• 二叉搜索树中可以支持插入相等的值,也可以不支持插入相等的值,具体看使用场景定义
⼆叉搜索树的性能分析
最优情况下,⼆叉搜索树为完全⼆叉树(或者接近完全⼆叉树),其高度为:O(log2 N)
最差情况下,二叉搜索树退化为单支树(或者类似单支),其⾼度为:O(N/2)
所以综合而言⼆叉搜索树增删查改时间复杂度为:O(N) 那么这样的效率显然是无法满足我们需求的,平衡⼆叉搜索树AVL树和红黑树,才能适用于我们在内存中存储和搜索数据。
另外需要说明的是,⼆分查找也可以实现O(logN) 级别的查找效率,但是⼆分查找有两大缺陷:
1. 需要存储在支持下标随机访问的结构中,并且有序。
2. 插⼊和删除数据效率很低,因为存储在下标随机访问的结构中,插⼊和删除数据⼀般需要挪动数 据。
这里也就体现出了平衡⼆叉搜索树的价值。
⼆叉搜索树模拟实现
结点
template<class K>
struct treenode
{
K _key;
treenode<K>* _left;
treenode<K>* _right;
treenode(const K& x)
:_key(x)
, _left(nullptr)
,_right(nullptr)
{}
};
这里我们使用模板来创建树结点,模板可以匹配任意类型的数值。
插入
插入的具体过程如下:
1. 树为空,则直接新增结点,赋值给root指针
2. 树不空,按⼆叉搜索树性质,插⼊值⽐当前结点大往右走,插⼊值比当前结点小往左走,找到空位置,插入新结点。
3. 如果支持插入相等的值,插入值跟当前结点相等的值可以往右走,也可以往左走,找到空位置,插入新结点。(要注意的是要保持逻辑⼀致性,插⼊相等的值不要⼀会往右走,⼀会往左走)
bool Insert(const T& key)
{
if (root == nullptr)
{
root = new Node(key);
return true;
}
Node* parent = nullptr;
Node* child = root;
while (child)
{
if (key > root->_key)
{
parent = child;
child = child->_right;
}
else if (key < root->_key)
{
parent = child;
child = child->_left;
}
else
{
return false;
}
}
child = new Node(key);
if (key > parent->_key)
{
parent->_right = child;
}
else
{
parent->_left = child;
}
return true;
}
这里的插入同样使用模板来处理,这里我们创建一个parent来存储循环中遍历结点的父母,child用来寻找树中空位置,之后在循环中不断遍历,查找空结点,一旦child为空,退出循环,利用parent的key来判断key的值是要存储在左边还是右边
查找
1. 从根开始比较,查找x,x比根的值大则往右边走查找,x比根值小则往左边走查找。
2. 最多查找高度次,走到到空,还没找到,这个值不存在。
3. 如果不支持插⼊相等的值,找到x即可返回
4. 如果支持插⼊相等的值,意味着有多个x存在,⼀般要求查找中序的第⼀个x。
Node* find(const T& x)
{
Node* cur = root;
while(cur)
{
if (x > cur->_key)
{
cur = cur->_right;
}
else if (x < cur->_key)
{
cur = cur->_left;
}
else
{
return cur;
}
}
return nullptr;
}
这里通过if语句来判断是否查找到相等的值,最后一个else对应的就是找到相等的值,如果找不到的话就在最后返回空。
删除
⾸先查找元素是否在⼆叉搜索树中,如果不存在,则返回false。
如果查找元素存在则分以下四种情况分别处理:(假设要删除的结点为N)
1. 要删除结点N左右孩子均为空
2. 要删除的结点N左孩子位空,右孩子结点不为空
3. 要删除的结点N右孩子位空,左孩子结点不为空
4. 要删除的结点N左右孩子结点均不为空
对应以上四种情况的解决方案:
1. 把N结点的父亲对应孩子指针指向空,直接删除N结点(情况1可以当成2或者3处理,效果是⼀样 的)
2. 把N结点的父亲对应孩子指针指向N的右孩子,直接删除N结点
3. 把N结点的父亲对应孩子指针指向N的左孩子,直接删除N结点
4. 无法直接删除N结点,因为N的两个孩子无处安放,只能用替换法删除。找N左子树的值最大结点R(最右结点)或者N右子树的值最小结点R(最左结点)替代N,因为这两个结点中任意⼀个,放到N的位置,都满足二叉搜索树的规则。替代N的意思就是N和R的两个结点的值交换,转⽽变成删除R结点,R结点符合情况2或情况3,可以直接删除。
bool Erase(const T& key)
{
Node* parent = nullptr;
Node* child = root;
while (child)
{
if (key > child->_key)
{
parent = child;
child = child->_right;
}
else if (key < child->_key)
{
parent = child;
child = child->_left;
}
else//找到cur的位置了
{
//左为空
if (child->_left == nullptr)
{
if (child == root)//树中只有一个结点的情况
{
root = child->_right;
}
else
{
if (child->_key > parent->_key)
{
parent->_right = child->_right;
}
else
{
parent->_left = child->_right;
}
}
delete child;
}
else if (child->_right == nullptr)//右为空
{
if (child == root)
{
root = child->_left;
}
else
{
if (child->_key > parent->_key)
{
parent->_right = child->_left;
}
else
{
parent->_left = child->_left;
}
delete child;
}
}
else
{
Node* rplace = child;
Node* rchild = child->_right;
while (rchild->_left)
{
rplace = rchild;
rchild = rchild->_left;
}
child->_key = rchild->_key;
if (rplace->_left == rchild)
{
rplace->_left = rchild->_right;
}
else
{
rplace->_right = rchild->_right;
}
delete rchild;
return true;
}
}
}
return false;
}
删除通过while循环来寻找需要删除的位置,删除的情况大体分为3种,左为空,右为空,左右不为空,因为左右孩子均为空的情况也可以通过作为空和右为空的情况去处理。
左为空和右为空的处理方法相似,都分为两种情况:树中只有一个结点和多个结点。
一个结点:将删除结点的左孩子或右孩子传给根结点。
多个结点:判断删除结点是父亲结点的左孩子还是右孩子,随后将删除结点的左孩子或右孩子传给父亲结点
左右不为空结点较难处理,首先要查找右树的最左结点,这里的replace和rchild用来循环查找右数最左结点,但是这里的rplace不能置空
像这里如果rplace置空的情况,10结点又不存在左结点,意味着不会通过循环,replace依旧是空,此时if语句中就会出现问题,rplace 在之后的语句中会处于空的状态。
如果没有进入循环的情况下,我们并不能无脑的进行判断rchild一定是rplace的左孩子,在删除8结点的时候,10结点并不是8结点的左孩子,所以我们要在之后进行判断,判断rchild到底是左孩子还是右孩子
⼆叉搜索树key和key/value使用场景
key搜索场景:
只有key作为关键码,结构中只需要存储key即可,关键码即为需要搜索到的值,搜索场景只需要判断key在不在。key的搜索场景实现的⼆叉树搜索树支持增删查,但是不支持修改,修改key破坏搜索树结构了。
场景1:小区无人值守车库,小区车库买了车位的业主车才能进小区,那么物业会把买了车位的业主的车牌号录入后台系统,车辆进入时扫描车牌在不在系统中,在则抬杆,不在则提示非本小区车辆,无法进入。
场景2:检查⼀篇英文文章单词拼写是否正确,将词库中所有单词放⼊⼆叉搜索树,读取文章中的单词,查找是否在⼆叉搜索树中,不在则波浪线标红提示。
key/value搜索场景:
每⼀个关键码key,都有与之对应的值value,value可以任意类型对象。树的结构中(结点)除了需要存 储key还要存储对应的value,增/删/查还是以key为关键字⾛⼆叉搜索树的规则进行比较,可以快速查找到key对应的value。key/value的搜索场景实现的⼆叉树搜索树支持修改,但是不支持修改key,修改key破坏搜索树结构了,可以修改value。
场景1:简单中英互译字典,树的结构中(结点)存储key(英⽂)和vlaue(中⽂),搜索时输⼊英文,则同时查找到了英文对应的中文。
场景2:商场无人值守⻋库,入口进场时扫描车牌,记录车牌和⼊场时间,出口离场时,扫描车牌,查找入场时间,用当前时间-入场时间计算出停车时长,计算出停车费用,缴费后抬杆,车辆离场。
场景3:统计⼀篇文章中单词出现的次数,读取⼀个单词,查找单词是否存在,不存在这个说明第⼀次 出现,(单词,1),单词存在,则++单词对应的次数。