二叉搜索树(key模型与key_value模型)
- 1. ⼆叉搜索树的概念
- 2. ⼆叉搜索树的性能分析
- 3. ⼆叉搜索树的插⼊
- 4. ⼆叉搜索树的查找
- 5. ⼆叉搜索树的删除
- 6. ⼆叉搜索树的实现代码
- 7. ⼆叉搜索树key和key/value使⽤场景
- 7.1 key搜索场景:
- 7.2 key/value搜索场景:
- 7.3 key/value⼆叉搜索树代码实现
- 8、运用于实际的key_value
今天我来介绍的是二叉搜索树,这一块我希望大家如果有不会的地方下来好好理解,这一节课与下一节的set/map关联挺大的。
1. ⼆叉搜索树的概念
⼆叉搜索树⼜称⼆叉排序树,它或者是⼀棵空树,或者是具有以下性质的⼆叉树:
–• 若它的左⼦树不为空,则左⼦树上所有结点的值都⼩于等于根结点的值
–• 若它的右⼦树不为空,则右⼦树上所有结点的值都⼤于等于根结点的值
–• 它的左右⼦树也分别为⼆叉搜索树
–• ⼆叉搜索树中可以⽀持插⼊相等的值,也可以不⽀持插⼊相等的值,具体看使⽤场景定义,后续我们学习map/set/multimap/multiset系列容器底层就是⼆叉搜索树,其中map/set不⽀持插⼊相等值,multimap/multiset⽀持插⼊相等值.(multimap/multiset)这一块我们下一节介绍,今天我主要介绍的是不允许冗余的情况
2. ⼆叉搜索树的性能分析
最优情况下,⼆叉搜索树为完全⼆叉树(或者接近完全⼆叉树),其⾼度为: O(log2 N)
最差情况下,⼆叉搜索树退化为单⽀树(或者类似单⽀),其⾼度为: O( N/2)
所以综合⽽⾔⼆叉搜索树增删查改时间复杂度为: O(N)
那么这样的效率显然是⽆法满⾜我们需求的,我们后续课程需要继续讲解⼆叉搜索树的变形,平衡⼆叉搜索树AVL树和红⿊树,才能适⽤于我们在内存中存储和搜索数据。
另外需要说明的是,⼆分查找也可以实现 O(logN) 级别的查找效率,但是⼆分查找有两⼤缺陷:
- 需要存储在⽀持下标随机访问的结构中,并且有序。
- 插⼊和删除数据效率很低,因为存储在下标随机访问的结构中,插⼊和删除数据⼀般需要挪动数据。
这⾥也就体现出了平衡⼆叉搜索树的价值。
3. ⼆叉搜索树的插⼊
以上的基本知识我们学习完后就来看一下二叉树的插入。
1、树为空,我们直接将第一个插入的节点作为根节点即可。
2、数不为空,按⼆叉搜索树性质,插⼊值⽐当前结点⼤往右⾛,插⼊值⽐当前结点⼩往左⾛,找到空位置,插⼊新结点。
3. 如果⽀持插⼊相等的值,插⼊值跟当前结点相等的值可以往右⾛,也可以往左⾛,找到空位置,插⼊新结点。(要注意的是要保持逻辑⼀致性,插⼊相等的值不要⼀会往右⾛,⼀会往左⾛)(这里我建议向左走,后序我们会学习平衡的概念,这棵树失衡的情况下,右节点会跑到左边)
这里我们可以按照之前学习二叉树时,二叉树的构建一样采用递归来插入,但这里有个简单的方式那就是循环,我们直接比较当前节点的值与插入的值的大小,如果小于就走左,大于就走右,等于直接就返回false(这里我只写不允许冗余,大家下来可以考虑有冗余的情况),如果当前节点走到空了,那这个位置就是我们需要插入的位置。
节点类:
template<class k>//k就是我们的key
struct BSTNode
{
k _key;
BSTNode<k>* _left;
BSTNode<k>* _right;
BSTNode(const k& x) :_key(x), _left(nullptr), _right(nullptr) {}//构造
};
//节点
插入部分:
bool insert(const k& x)
{
if (_root == nullptr)
{
_root = new Node(x);
}
//根节点为空
Node* parent = nullptr;
Node* cur = _root;
while (cur)
{
if (x < cur->_key)
{
parent = cur;
cur = cur->_left;
}
else if (x > cur->_key)
{
parent = cur;
cur = cur->_right;
}
else
return false;
}
//找到该插入的位置,为cur
cur = new Node(x);
//找到以后还需要判断它插入在父节点哪一边
if (x < parent->_key)
{
parent->_left = cur;
}
else
{
parent->_right = cur;
}
return 0;
}
这里是需要引入cur(当前节点)的parent(父亲指针)的,因为我们要插入节点,需要将插入的节点与整棵树链接。
这一块写完不好测试对吧,因为调试窗口只能看到节点插入与否,那我们写一个中序遍历,首先搜索二叉树永远是一个左小于根,根小于右的结构,中序遍历一定是一个递增的数列,这一块要是不知道的建议去其他地方找视频看,文字不好演示,这里就不做演示了。
void _inorder(const Node* root)
{
if (root == nullptr)
return;
_inorder(root->_left);
cout << root->_key << ' ';
_inorder(root->_right);
}
这就是中序的代码,但是我们可以看到,要调用这个函数必须要传一个节点指针,二叉树的私有成员就是我们的_root指针,我们能在外部访问我们的根再传入吗?
为了不破坏类的封装,这里有两种方式解决:
1、getroot函数,提供访问根节点的指针。
2、再写一个共有的调用_inorder的函数,类外部不能访问,类内部是可以访问的。
void inorder()
{
_inorder(_root);
cout << endl;
}
这样就搞定了。
那现在我们来测试一下:
这里的key模型担任的工作是不是可以有去重加排序啊。
4. ⼆叉搜索树的查找
- 从根开始⽐较,查找x,x⽐根的值⼤则往右边⾛查找,x⽐根值⼩则往左边⾛查找。
- 最多查找⾼度次,⾛到到空,还没找到,这个值不存在。
- 如果不⽀持插⼊相等的值,找到x即可返回
- 如果⽀持插⼊相等的值,意味着有多个x存在,⼀般要求查找中序的第⼀个x。如下图,查找3,要找到1的右孩⼦的那个3返回
写完插入写查找是不是就太简单了啊
Node* find(const k& x)
{
Node* cur = _root;
while (cur)
{
if (x < cur->_key)
cur = cur->_left;
else if (x > cur->_key)
cur = cur->_right;
else
return cur;
}
return nullptr;
}
这里我们就不需要parent了,因为我们只是查找当前节点在不在,跟父节点没有半毛钱关系对吧。
5. ⼆叉搜索树的删除
⾸先查找元素是否在⼆叉搜索树中,如果不存在,则返回false。
如果查找元素存在则分以下四种情况分别处理:(假设要删除的结点为N)
- 要删除结点N左右孩⼦均为空
- 要删除的结点N左孩⼦位空,右孩⼦结点不为空
- 要删除的结点N右孩⼦位空,左孩⼦结点不为空
- 要删除的结点N左右孩⼦结点均不为空
对应以上四种情况的解决⽅案:
5. 把N结点的⽗亲对应孩⼦指针指向空,直接删除N结点(情况1可以当成2或者3处理,效果是⼀样的)
6. 把N结点的⽗亲对应孩⼦指针指向N的右孩⼦,直接删除N结点
7. 把N结点的⽗亲对应孩⼦指针指向N的左孩⼦,直接删除N结点
8. ⽆法直接删除N结点,因为N的两个孩⼦⽆处安放,只能⽤替换法删除。找N左⼦树的值最⼤结点R(最右结点)或者N右⼦树的值最⼩结点R(最左结点)替代N,因为这两个结点中任意⼀个,放到N的位置,都满⾜⼆叉搜索树的规则。替代N的意思就是N和R的两个结点的值交换,转⽽变成删除R结点,R结点符合情况2或情况3,可以直接删除。
这是第一种与第二种情况。
第三种情况较为复杂一点:
bool erase(const k& x)
{
Node* parent = nullptr;
Node* cur = _root;
while (cur)
{
if (x < cur->_key)
{
parent = cur;
cur = cur->_left;
}
else if (x > cur->_key)
{
parent = cur;
cur = cur->_right;
}
else//找到当前位置
{
if (cur->_left == nullptr)//左为空
{
if (_root == cur)//特殊情况,当cur为空,且左为空,就将根移动
{
_root = cur->_right;
}
else
{
if (cur == parent->_left)
parent->_left = cur->_right;
else
parent->_right = cur->_right;
}
delete cur;
}
else if (cur->_right == nullptr)//右为空
{
if (_root == cur)//同上
{
_root = cur->_left;
}
else
{
if (cur == parent->_left)
parent->_left = cur->_left;
else
parent->_right = cur->_left;
}
delete cur;
}
else//双边节点
{
Node* replaceparent = cur;
Node* replace = cur->_right;
while (replace->_left)
{
replaceparent = replace;
replace = replace->_left;
}
cur->_key = replace->_key;
//replace的左边一定没有节点了
if (replace == replaceparent->_left)
replaceparent->_left = replace;
else
replaceparent->_right = replace;
delete replace;
}
return true;
}
}
return false;
}
6. ⼆叉搜索树的实现代码
#include<iostream>
using namespace std;
namespace key
{
template<class k>
struct BSTNode
{
k _key;
BSTNode<k>* _left;
BSTNode<k>* _right;
BSTNode(const k& x) :_key(x), _left(nullptr), _right(nullptr) {}
};
//节点
template<class k>
class BSTree
{
typedef BSTNode<k> Node;
public:
BSTree() = default;//强制生成构造
BSTree(const BSTree& t)
{
_root = copy(t._root);
}//拷贝构造,这块比较简单,如果实在不懂的话私聊我
BSTree& operator=(BSTree t)
{
swap(_root, t._root);
return *this;
}//赋值构造
~BSTree()
{
destroy(_root);
_root = nullptr;
}//析构采用一个后序遍历即可
bool insert(const k& x)
{
if (_root == nullptr)
{
_root = new Node(x);
}
//根节点为空
Node* parent = nullptr;
Node* cur = _root;
while (cur)
{
if (x < cur->_key)
{
parent = cur;
cur = cur->_left;
}
else if (x > cur->_key)
{
parent = cur;
cur = cur->_right;
}
else
return false;
}
//找到该插入的位置,为cur
cur = new Node(x);
if (x < parent->_key)
{
parent->_left = cur;
}
else
{
parent->_right = cur;
}
return 0;
}
void inorder()
{
_inorder(_root);
cout << endl;
}
bool erase(const k& x)
{
Node* parent = nullptr;
Node* cur = _root;
while (cur)
{
if (x < cur->_key)
{
parent = cur;
cur = cur->_left;
}
else if (x > cur->_key)
{
parent = cur;
cur = cur->_right;
}
else//找到当前位置
{
if (cur->_left == nullptr)
{
if (_root == cur)
{
_root = cur->_right;
}
else
{
if (cur == parent->_left)
parent->_left = cur->_right;
else
parent->_right = cur->_right;
}
delete cur;
}
else if (cur->_right == nullptr)
{
if (_root == cur)
{
_root = cur->_left;
}
else
{
if (cur == parent->_left)
parent->_left = cur->_left;
else
parent->_right = cur->_left;
}
delete cur;
}
else//双边节点
{
Node* replaceparent = cur;
Node* replace = cur->_right;
while (replace->_left)
{
replaceparent = replace;
replace = replace->_left;
}
cur->_key = replace->_key;
//replace的左边一定没有节点了
if (replace == replaceparent->_left)
replaceparent->_left = replace;
else
replaceparent->_right = replace;
delete replace;
}
return true;
}
}
return false;
}
Node* find(const k& x)
{
Node* cur = _root;
while (cur)
{
if (x < cur->_key)
cur = cur->_left;
else if (x > cur->_key)
cur = cur->_right;
else
return cur;
}
return nullptr;
}
private:
void _inorder(const Node* root)
{
if (root == nullptr)
return;
_inorder(root->_left);
cout << root->_key << ' ';
_inorder(root->_right);
}
void destroy(Node* root)
{
if (root == nullptr)
return;
destroy(root->_left);
destroy(root->_right);
delete root;
}
Node* copy(Node* root)
{
if (root == nullptr)
return nullptr;
Node* r = new Node(root->_key);
r->_left = copy(root->_left);
r->_right = copy(root->_right);
return r;
}
Node* _root = nullptr;
};
}
这份代码是key的模型,什么是key_value呢?就是每个节点存储两个值,key跟上面写的一样作为插入删除等等的基准,value想存啥就存啥。
7. ⼆叉搜索树key和key/value使⽤场景
7.1 key搜索场景:
只有key作为关键码,结构中只需要存储key即可,关键码即为需要搜索到的值,搜索场景只需要判断key在不在。key的搜索场景实现的⼆叉树搜索树⽀持增删查,但是不⽀持修改,修改key破坏搜索树结构了。
场景1:⼩区⽆⼈值守⻋库,⼩区⻋库买了⻋位的业主⻋才能进⼩区,那么物业会把买了⻋位的业主的⻋牌号录⼊后台系统,⻋辆进⼊时扫描⻋牌在不在系统中,在则抬杆,不在则提⽰⾮本⼩区⻋辆,⽆法进⼊。
场景2:检查⼀篇英⽂⽂章单词拼写是否正确,将词库中所有单词放⼊⼆叉搜索树,读取⽂章中的单词,查找是否在⼆叉搜索树中,不在则波浪线标红提⽰。
7.2 key/value搜索场景:
每⼀个关键码key,都有与之对应的值value,value可以任意类型对象。树的结构中(结点)除了需要存储key还要存储对应的value,增/删/查还是以key为关键字⾛⼆叉搜索树的规则进⾏⽐较,可以快速查找到key对应的value。key/value的搜索场景实现的⼆叉树搜索树⽀持修改,但是不⽀持修改key,修改key破坏搜索树结构了,可以修改value。
场景1:简单中英互译字典,树的结构中(结点)存储key(英⽂)和vlaue(中⽂),搜索时输⼊英⽂,则同时查找到了英⽂对应的中⽂。
场景2:商场⽆⼈值守⻋库,⼊⼝进场时扫描⻋牌,记录⻋牌和⼊场时间,出⼝离场时,扫描⻋牌,查找⼊场时间,⽤当前时间-⼊场时间计算出停⻋时⻓,计算出停⻋费⽤,缴费后抬杆,⻋辆离场。
场景3:统计⼀篇⽂章中单词出现的次数,读取⼀个单词,查找单词是否存在,不存在这个说明第⼀次出现,(单词,1),单词存在,则++单词对应的次数。
7.3 key/value⼆叉搜索树代码实现
这里只需要增加一个模版参数即可
namespace key_value
{
template<class k,class v>
struct BSTNode
{
k _key;
v _value;
BSTNode<k,v>* _left;
BSTNode<k,v>* _right;
BSTNode(const k& x,const v& y) :_key(x), _value(y), _left(nullptr), _right(nullptr) {}
};
//节点
template<class k,class v>
class BSTree
{
typedef BSTNode<k,v> Node;
public:
BSTree() = default;//强制生成构造
BSTree(const BSTree& t)
{
_root = copy(t._root);
}
BSTree& operator=(BSTree t)
{
swap(_root, t._root);
return *this;
}
~BSTree()
{
destroy(_root);
_root = nullptr;
}
bool insert(const k& x,const v& y)
{
if (_root == nullptr)
{
_root = new Node(x, y);
}
//根节点为空
Node* parent = nullptr;
Node* cur = _root;
while (cur)
{
if (x < cur->_key)
{
parent = cur;
cur = cur->_left;
}
else if (x > cur->_key)
{
parent = cur;
cur = cur->_right;
}
else
return false;
}
//找到该插入的位置,为cur
cur = new Node(x,y);
if (x < parent->_key)
{
parent->_left = cur;
}
else
{
parent->_right = cur;
}
return 0;
}
void inorder()
{
_inorder(_root);
cout << endl;
}
bool erase(const k& x)
{
Node* parent = nullptr;
Node* cur = _root;
while (cur)
{
if (x < cur->_key)
{
parent = cur;
cur = cur->_left;
}
else if (x > cur->_key)
{
parent = cur;
cur = cur->_right;
}
else//找到当前位置
{
if (cur->_left == nullptr)
{
if (_root == cur)
{
_root = cur->_right;
}
else
{
if (cur == parent->_left)
parent->_left = cur->_right;
else
parent->_right = cur->_right;
}
delete cur;
}
else if (cur->_right == nullptr)
{
if (_root == cur)
{
_root = cur->_left;
}
else
{
if (cur == parent->_left)
parent->_left = cur->_left;
else
parent->_right = cur->_left;
}
delete cur;
}
else//双边节点
{
Node* replaceparent = cur;
Node* replace = cur->_right;
while (replace->_left)
{
replaceparent = replace;
replace = replace->_left;
}
cur->_key = replace->_key;
//replace的左边一定没有节点了
if (replace == replaceparent->_left)
replaceparent->_left = replace;
else
replaceparent->_right = replace;
delete replace;
}
return true;
}
}
return false;
}
Node* find(const k& x)
{
Node* cur = _root;
while (cur)
{
if (x < cur->_key)
cur = cur->_left;
else if (x > cur->_key)
cur = cur->_right;
else
return cur;
}
return nullptr;
}
private:
void _inorder(const Node* root)
{
if (root == nullptr)
return;
_inorder(root->_left);
cout << root->_key << "->" << root->_value << endl;
_inorder(root->_right);
}
void destroy(Node* root)
{
if (root == nullptr)
return;
destroy(root->_left);
destroy(root->_right);
delete root;
}
Node* copy(Node* root)
{
if (root == nullptr)
return nullptr;
Node* r = new Node(root->_key,root->_value);
r->_left = copy(root->_left);
r->_right = copy(root->_right);
return r;
}
Node* _root = nullptr;
};
}
8、运用于实际的key_value
void test4()
{
string arr[] = { "苹果", "西瓜", "苹果", "西瓜", "苹果", "苹果", "西瓜",
"苹果", "香蕉", "苹果", "香蕉" };
key_value::BSTree<string, int> countTree;
for (const auto& str : arr)
{
// 先查找水果在不在搜索树中
// 1、不在,说明水果第一次出现,则插入<水果, 1>
// 2、在,则查找到的结点中水果对应的次数++
//BSTreeNode<string, int>* ret = countTree.Find(str);
auto ret = countTree.find(str);
if (ret == nullptr)
{
countTree.insert(str, 1);
}
else
{
// 修改value
ret->_value++;
}
}
countTree.inorder();
key_value::BSTree<string, int> copy = countTree;
copy.inorder();
}