文章目录
- 1. 二叉搜索树的概念
- 2. 二叉搜索树的性能分析
- 3. 二叉搜索树的插入
- 4. 二叉搜索树的查找
- 5. 二叉搜索树的删除
- 6. 二叉搜索树的实现代码
- 7. 二叉搜索树key和key/value使用场景
- 7.1 key搜索场景:
- 7.2 key/value搜索场景:
- 7.3 主要区别:
- 7.4 key/value二叉搜索树代码实现
1. 二叉搜索树的概念
二叉搜索树又称二叉排序树,它或者是一棵空树,或者是具有以下性质的二叉树:
-
若它的左子树不为空,则左子树上所有结点的值都小于等于根结点的值
-
若它的右子树不为空,则右子树上所有结点的值都大于等于根结点的值
-
它的左右子树也分别为二叉搜索树
-
二叉搜索树中可以支持插入相等的值,也可以不支持插入相等的值,具体看使用场景定义,后续我们学习
map/set/multimap/multiset
系列容器底层就是二叉搜索树,其中map/set
不支持插入相等值,multimap/multiset
支持插入相等值
2. 二叉搜索树的性能分析
最优情况下,二叉搜索树为完全二叉树(或者接近完全二叉树),其高度为:log2N
最差情况下,二叉搜索树退化为单支树(或者类似单支),其高度为:N
所以综合而言二叉搜索树增删查改时间复杂度为:O(N)
那么这样的效率显然是无法满足我们需求的,我们后续课程需要继续讲解二叉搜索树的变形,平衡二叉搜索树AVL
树和红黑树,才能适用于我们在内存中存储和搜索数据。
另外需要说明的是,二分查找也可以实现O(log2N)
级别的查找效率,但是二分查找有两大缺陷:
- 需要存储在支持下标随机访问的结构中,并且有序。
- 插入和删除数据效率很低,因为存储在下标随机访问的结构中,插入和删除数据一般需要挪动数据。
这里也就体现出了平衡二叉搜索树的价值。
3. 二叉搜索树的插入
插入的具体过程如下:
- 树为空,则直接新增结点,赋值给
root
指针 - 树不空,按二叉搜索树性质,插入值比当前结点大往右走,插入值比当前结点小往左走,找到空位置,插入新结点。
- 如果支持插入相等的值,插入值跟当前结点相等的值可以往右走,也可以往左走,找到空位置,插入新结点。(要注意的是要保持逻辑一致性,插入相等的值不要一会往右走,一会往左走)
int a[] = {8, 3, 1, 10, 6, 4, 7, 14, 13};
4. 二叉搜索树的查找
- 从根开始比较,查找
x
,x
比根的值大则往右边走查找,x
比根值小则往左边走查找。 - 最多查找高度次,走到到空,还没找到,这个值不存在。
- 如果不支持插入相等的值,找到
x
即可返回 - 如果支持插入相等的值,意味着有多个
x
存在,一般要求查找中序的第一个x
。如下图,查找3,要找到1的右孩子的那个3返回
5. 二叉搜索树的删除
首先查找元素是否在二叉搜索树中,如果不存在,则返回false
。
如果查找元素存在则分以下四种情况分别处理:(假设要删除的结点为N
)
- 要删除结点
N
左右孩子均为空 - 要删除的结点
N
左孩子为空,右孩子结点不为空 - 要删除的结点
N
右孩子为空,左孩子结点不为空 - 要删除的结点
N
左右孩子结点均不为空对应以上四种情况的解决方案: - 把
N
结点的父亲对应孩子指针指向空,直接删除N
结点(情况1可以当成2或者3处理,效果是一样的) - 把
N
结点的父亲对应孩子指针指向N
的右孩子,直接删除N
结点 - 把
N
结点的父亲对应孩子指针指向N
的左孩子,直接删除N
结点 - 无法直接删除
N
结点,因为N
的两个孩子无处安放,只能用替换法删除。找N
左子树的值最大结点R
(最右结点)或者N
右子树的值最小结点R
(最左结点)替代N
,因为这两个结点中任意一个,放到N
的位置,都满足二叉搜索树的规则。替代N
的意思就是N
和R
的两个结点的值交换,转而变成删除R
结点,R
结点符合情况2或情况3,可以直接删除。
简单来说就是:
- 删除叶子节点–>直接删
- 被删除结点无左子树–>将该节点右子树的根代替该节点
例如:要删除23,可以把34代替它。
- 被删除结点无右子树–>将该节点左子树的根代替该节点
例如:要删除8,可以把1代替它。
- 左右都有孩子–>找它的前驱(左子树里最大的元素)或者后继(右子树里最小的元素)
例如:删除39
可以直接把34换过去,也可以把46换过去,46换过去就和上面第二点一样。
6. 二叉搜索树的实现代码
// 二叉搜索树节点结构
template<class K>
struct BSTNode
{
K _key; // 节点中存储的关键码
BSTNode<K>* _left; // 左子树指针
BSTNode<K>* _right; // 右子树指针
// 节点构造函数
BSTNode(const K& key)
:_key(key)
, _left(nullptr)
, _right(nullptr)
{}
};
// 二叉搜索树类
template<class K>
class BSTree
{
typedef BSTNode<K> Node; // 类型重定义,简化代码
public:
// 插入关键码key
bool Insert(const K& key)
{
// 空树情况:直接创建根节点
if (_root == nullptr)
{
_root = new Node(key);
return true;
}
// 非空树:查找插入位置
Node* parent = nullptr; // 记录父节点
Node* cur = _root; // 当前遍历节点
while (cur)
{
if (cur->_key < key) // key大,往右走
{
parent = cur;
cur = cur->_right;
}
else if (cur->_key > key) // key小,往左走
{
parent = cur;
cur = cur->_left;
}
else // key已存在
{
return false;
}
}
// 创建新节点并连接到合适位置
cur = new Node(key);
if (parent->_key < key)
parent->_right = cur;
else
parent->_left = cur;
return true;
}
// 查找关键码key是否存在
bool Find(const K& key)
{
Node* cur = _root;
while (cur)
{
if (cur->_key < key) // key大,往右找
cur = cur->_right;
else if (cur->_key > key) // key小,往左找
cur = cur->_left;
else // 找到了
return true;
}
return false; // 没找到
}
// 删除关键码key
bool Erase(const K& key)
{
Node* parent = nullptr;
Node* cur = _root;
// 查找要删除的节点
while (cur)
{
if (cur->_key < key)
{
parent = cur;
cur = cur->_right;
}
else if (cur->_key > key)
{
parent = cur;
cur = cur->_left;
}
else // 找到要删除的节点
{
// 情况1:左子树为空
if (cur->_left == nullptr)
{
if (parent == nullptr) // 要删除的是根节点
{
_root = cur->_right;
}
else // 非根节点
{
// 将父节点对应的指针指向被删除节点的右子树
if (parent->_left == cur)
parent->_left = cur->_right;
else
parent->_right = cur->_right;
}
delete cur;
return true;
}
// 情况2:右子树为空
else if (cur->_right == nullptr)
{
if (parent == nullptr) // 要删除的是根节点
{
_root = cur->_left;
}
else // 非根节点
{
// 将父节点对应的指针指向被删除节点的左子树
if (parent->_left == cur)
parent->_left = cur->_left;
else
parent->_right = cur->_left;
}
delete cur;
return true;
}
// 情况3:左右子树都不为空
else
{
// 找右子树最小节点(最左节点)替换当前节点
Node* rightMinP = cur; // 最小节点的父节点
Node* rightMin = cur->_right; // 最小节点
while (rightMin->_left)
{
rightMinP = rightMin;
rightMin = rightMin->_left;
}
// 用最小节点的值替换当前节点的值
cur->_key = rightMin->_key;
// 删除最小节点
if (rightMinP->_left == rightMin)
rightMinP->_left = rightMin->_right;
else
rightMinP->_right = rightMin->_right;
delete rightMin;
return true;
}
}
}
return false; // 没找到要删除的节点
}
// 中序遍历入口函数
void InOrder()
{
_InOrder(_root);
cout << endl;
}
private:
// 中序遍历实现函数
void _InOrder(Node* root)
{
if (root == nullptr)
return;
_InOrder(root->_left); // 遍历左子树
cout << root->_key << " "; // 访问根节点
_InOrder(root->_right); // 遍历右子树
}
private:
Node* _root = nullptr; // 树的根节点指针
};
7. 二叉搜索树key和key/value使用场景
7.1 key搜索场景:
只有key
作为关键码,结构中只需要存储key
即可,关键码即为需要搜索到的值,搜索场景只需要判断key
在不在。key
的搜索场景实现的二叉树搜索树支持增删查,但是不支持修改,修改key
破坏搜索树结构了。
场景1:小区无人值守车库,小区车库买了车位的业主车才能进小区,那么物业会把买了车位的业主的车牌号录入后台系统,车辆进入时扫描车牌在不在系统中,在则抬杆,不在则提示非本小区车辆,无法进入。
场景2:检查一篇英文章单词拼写是否正确,将词库中所有单词放入二叉搜索树,读取文章中的单词,查找是否在二叉搜索树中,不在则波浪线标红提示。
在二叉搜索树中,key实际上是可以修改的,但是不建议直接修改key,原因如下:
- 破坏二叉搜索树的性质:
例如这样的树:
5
/ \
3 7
/ \
6 8
如果我们直接修改节点6的key为9:
5
/ \
3 7
/ \
9 8 // 破坏了BST性质!
- 正确的修改方式:
// 如果需要修改key,应该:
1. 先删除旧的节点
2. 再插入新的节点
// 伪代码:
void ModifyKey(const K& oldKey, const K& newKey)
{
Node* node = Find(oldKey);
if (node)
{
V value = node->_value; // 保存原来的value
Erase(oldKey); // 删除旧节点
Insert(newKey, value); // 插入新节点
}
}
总结:
key
可以修改,但不建议直接修改- 如果需要修改
key
,应该通过删除旧节点并插入新节点的方式- 这样可以保证二叉搜索树的基本性质不被破坏
- 保持树结构的正确性和查找效率
7.2 key/value搜索场景:
每一个关键码key
,都有与之对应的值value
,value
可以任意类型对象。树的结构中(结点)除了需要存储key
还要存储对应的value
,增/删/查还是以key
为关键字走二叉搜索树的规则进行比较,可以快速查找到key
对应的value
。key/value
的搜索场景实现的二叉树搜索树支持修改,但是不支持修改key
,修改key
破坏搜索树性质了,可以修改value
。
场景1:简单中英互译字典,树的结构中(结点)存储key
(英文)和vlaue
(中文),搜索时输入英文,则同时查找到了英文对应的中文。
场景2:商场无人值守车库,入口进场时扫描车牌,记录车牌和入场时间,出口离场时,扫描车牌,查找入场时间,用当前时间-入场时间计算出停车时长,计算出停车费用,缴费后抬杆,车辆离场。
场景3:统计一篇文章中单词出现的次数,读取一个单词,查找单词是否存在,不存在这个说明第一次出现,(单词,1),单词存在,则++单词对应的次数。
7.3 主要区别:
- 只有
key
的场景:- 只需要判断存在性
- 不能修改
key
- 数据结构更简单
key-value
的场景:- 需要存储和查找关联数据
- 可以修改
value
- 不能修改
key
- 适合需要映射关系的场景
注意事项:
- 两种情况都不能修改
key
,因为会破坏二叉搜索树的性质 key-value
结构更灵活,但占用更多内存- 选择哪种结构取决于具体应用需求
7.4 key/value二叉搜索树代码实现
// 二叉搜索树节点结构,支持key-value对
template<class K, class V>
struct BSTNode
{
// pair<K, V> _kv; // 也可以用pair存储键值对
K _key; // 关键码
V _value; // 对应的值
BSTNode<K, V>* _left; // 左子树指针
BSTNode<K, V>* _right; // 右子树指针
// 节点构造函数
BSTNode(const K& key, const V& value)
:_key(key)
, _value(value)
, _left(nullptr)
, _right(nullptr)
{}
};
// 二叉搜索树类
template<class K, class V>
class BSTree
{
typedef BSTNode<K, V> Node;
public:
BSTree() = default; // 使用默认构造函数
// 拷贝构造函数
BSTree(const BSTree<K, V>& t)
{
_root = Copy(t._root); // 深拷贝
}
// 赋值运算符重载(现代写法:拷贝交换)
BSTree<K, V>& operator=(BSTree<K, V> t)
{
swap(_root, t._root); // 交换根节点
return *this;
}
// 析构函数
~BSTree()
{
Destroy(_root); // 释放所有节点
_root = nullptr;
}
// 插入键值对
bool Insert(const K& key, const V& value)
{
// 空树情况
if (_root == nullptr)
{
_root = new Node(key, value);
return true;
}
// 查找插入位置
Node* parent = nullptr;
Node* cur = _root;
while (cur)
{
if (cur->_key < key)
{
parent = cur;
cur = cur->_right;
}
else if (cur->_key > key)
{
parent = cur;
cur = cur->_left;
}
else // 键已存在
{
return false;
}
}
// 创建新节点并连接
cur = new Node(key, value);
if (parent->_key < key)
parent->_right = cur;
else
parent->_left = cur;
return true;
}
// 查找指定key的节点,返回节点指针
Node* Find(const K& key)
{
Node* cur = _root;
while (cur)
{
if (cur->_key < key)
cur = cur->_right;
else if (cur->_key > key)
cur = cur->_left;
else
return cur; // 找到返回节点指针
}
return nullptr; // 没找到返回空
}
// 删除指定key的节点
bool Erase(const K& key)
{
Node* parent = nullptr;
Node* cur = _root;
while (cur)
{
if (cur->_key < key)
{
parent = cur;
cur = cur->_right;
}
else if (cur->_key > key)
{
parent = cur;
cur = cur->_left;
}
else // 找到要删除的节点
{
// 情况1:左子树为空
if (cur->_left == nullptr)
{
if (parent == nullptr) // 删除的是根节点
_root = cur->_right;
else
{
if (parent->_left == cur)
parent->_left = cur->_right;
else
parent->_right = cur->_right;
}
delete cur;
return true;
}
// 情况2:右子树为空
else if (cur->_right == nullptr)
{
if (parent == nullptr) // 删除的是根节点
_root = cur->_left;
else
{
if (parent->_left == cur)
parent->_left = cur->_left;
else
parent->_right = cur->_left;
}
delete cur;
return true;
}
// 情况3:左右子树都不为空
else
{
// 找右子树最小节点
Node* rightMinP = cur;
Node* rightMin = cur->_right;
while (rightMin->_left)
{
rightMinP = rightMin;
rightMin = rightMin->_left;
}
// 替换当前节点的值
cur->_key = rightMin->_key;
// 删除替换节点
if (rightMinP->_left == rightMin)
rightMinP->_left = rightMin->_right;
else
rightMinP->_right = rightMin->_right;
delete rightMin;
return true;
}
}
}
return false;
}
// 中序遍历入口函数
void InOrder()
{
_InOrder(_root);
cout << endl;
}
private:
// 中序遍历实现函数
void _InOrder(Node* root)
{
if (root == nullptr)
return;
_InOrder(root->_left);
cout << root->_key << ":" << root->_value << endl;
_InOrder(root->_right);
}
// 销毁树的递归函数
void Destroy(Node* root)
{
if (root == nullptr)
return;
Destroy(root->_left); // 销毁左子树
Destroy(root->_right); // 销毁右子树
delete root; // 删除当前节点
}
// 拷贝树的递归函数
Node* Copy(Node* root)
{
if (root == nullptr)
return nullptr;
// 创建新节点并递归拷贝左右子树
Node* newRoot = new Node(root->_key, root->_value);
newRoot->_left = Copy(root->_left);
newRoot->_right = Copy(root->_right);
return newRoot;
}
private:
Node* _root = nullptr; // 树的根节点
};
// 示例1:简单的英汉字典
int main()
{
BSTree<string, string> dict;
// 插入单词和翻译
dict.Insert("left", "左边");
dict.Insert("right", "右边");
dict.Insert("insert", "插入");
dict.Insert("string", "字符串");
// 查询单词
string str;
while (cin>>str)
{
auto ret = dict.Find(str);
if (ret)
cout << "->" << ret->_value << endl;
else
cout << "无此单词,请重新输入" << endl;
}
return 0;
}
// 示例2:统计水果出现次数
int main()
{
string arr[] = { "苹果", "西瓜", "苹果", "西瓜", "苹果", "苹果", "西瓜", "苹果", "香蕉", "苹果", "香蕉" };
BSTree<string, int> countTree;
// 遍历数组统计每个水果出现的次数
for (const auto& str : arr)
{
auto ret = countTree.Find(str);
if (ret == NULL)
countTree.Insert(str, 1); // 第一次出现
else
ret->_value++; // 已存在,计数加1
}
// 打印统计结果
countTree.InOrder();
return 0;
}