目录
一.AVL的概念
二.AVL的实现
2.1AVL树的结构
2.2AVL树的插入
2.2.1AVL树插入一个值的大概过程
2.2.2平衡因子更新
2.2.3插入节点及更新平衡因子的实现
2.3旋转
2.3.1旋转的原则
2.3.2右单旋
2.3.3右单旋的代码实现
2.3.4左单旋
2.3.5左单旋的代码实现
2.3.6左右双旋
2.3.7左右双旋代码实现
2.3.8右左双旋
编辑 2.3.9右左双旋的代码实现
2.4AVL树的查找
2.5AVL树平衡检测
2.6补全insert
一.AVL的概念
AVL树是最先发明的自平衡二叉查找树,AVL是⼀颗空树,或者具备下列性质的二叉搜索树:它的 左右子树都是AV树,且左右子树的高度差的绝对值不超过1。AVL树是⼀颗高度平衡搜索二叉树, 通过控制高度差去控制平衡。
AVL树实现这里引入⼀个平衡因子(balance factor)的概念,每个结点都有⼀个平衡因子,任何结点的平衡因子等于右子树的高度减去左子树的高度,也就是说任何结点的平衡因子等于0/1/-1, AVL树并不是必须要平衡因子,但是有了平衡因子可以更方便我们去进行观察和控制树是否平衡, 就像⼀个风向标⼀样。
思考一下为什么AVL树是高度平衡搜索二叉树,要求高度差不超过1,而不是高度差是0呢?0不是更好的平衡吗?画画图分析我们发现,不是不想这样设计,而是有些情况是做不到高度差是0的。比如一棵树是2个结点,4个结点等情况下,高度差最好就是1,无法作为高度差是0
AVL树整体结点数量和分布和完全二叉树类似,高度可以控制在logN ,那么增删查改的效率也可 以控制在O(logN) ,相比二叉搜索树有了本质的提升。
二.AVL的实现
2.1AVL树的结构
树的每一个节点包含一个pair,左右子树的指针,父亲节点的指针,还有一个AVL树特有的平衡因子。
template<class K, class V>
struct AVLTreeNode
{
// 需要parent指针,后续更新平衡因子可以看到
pair<K, V> _kv;
AVLTreeNode<K, V>* _left;
AVLTreeNode<K, V>* _right;
AVLTreeNode<K, V>* _parent;
int _bf; // balance factor 平衡因子
AVLTreeNode(const pair<K, V>& kv)
: _kv(kv)
, _left(nullptr)
, _right(nullptr)
, _parent(nullptr)
, _bf(0)
{}
};
template<class K, class V>
class AVLTree
{
typedef AVLTreeNode<K, V> Node;
public:
//...
private:
Node* _root = nullptr;
};
2.2AVL树的插入
2.2.1AVL树插入一个值的大概过程
1. 插入一个值按二叉搜索树规则进行插入。
2. 新增结点以后,只会影响祖先结点的高度,也就是可能会影响部分祖先结点的平衡因子,所以更新从新增结点->根结点路径上的平衡因子,实际中最坏情况下要更新到根,有些情况更新到中间就可以停止了。
3. 更新平衡因子过程中没有出现问题,则插入结束
4. 更新平衡因子过程中出现不平衡,对不平衡子树旋转,旋转后本质调平衡的同时,本质降低了子树的高度,不会再影响上一层,所以插入结束。
2.2.2平衡因子更新
更新原则:
• 平衡因子 = 右子树高度-左子树高度
• 只有子树高度变化才会影响当前结点平衡因子。
• 插入结点,会增加高度,所以新增结点在parent的右子树,parent的平衡因子++,新增结点在 parent的左子树,parent平衡因子--
• parent所在子树的高度是否变化决定了是否会继续往上更新。
更新停止条件:
• 更新后parent的平衡因子等于0,更新中parent的平衡因子变化为-1->0或者1->0,说明更新前 parent子树一边高⼀边低,新增的结点插入在低的那边,插入后parent所在的子树高度不变,不会 影响parent的父亲结点的平衡因子,更新结束。
• 更新后parent的平衡因子等于1或-1,更新前更新中parent的平衡因子变化为0->1或者0->-1,说 明更新前parent子树两边⼀样高,新增的插入结点后,parent所在的子树一边高⼀边低,parent所 在的子树符合平衡要求,但是高度增加了1,会影响parent的父亲结点的平衡因子,所以要继续向上更新。
• 更新后parent的平衡因子等于2或-2,更新前更新中parent的平衡因子变化为1->2或者-1->-2,说 明更新前parent子树一边高一边低,新增的插入结点在高的那边,parent所在的子树高的那边更高 了,破坏了平衡,parent所在的子树不符合平衡要求,需要旋转处理,旋转的目标有两个:1、把 parent子树旋转平衡。2、降低parent子树的高度,恢复到插入结点以前的高度。所以旋转后也不需要继续往上更新,插入结束。
更新到10结点,平衡因子为2,10所在的子树已经不平衡,需要旋转处理。
更新到中间结点,3为根的子树高度不变,不会影响上⼀层,更新结束。
最坏更新到根
2.2.3插入节点及更新平衡因子的实现
template<class K,class V>
class AVLTree
{
typedef AVLTreeNode<K,V> Node;
public:
bool Insert(const pair<K, V>& kv)
{
if (_root == nullptr)
{
_root = new Node(kv);
return true;
}
Node* parent = nullptr;
Node* cur = _root;
//while循环找到需要插入节点的位置
while (cur)
{
//插入的值大于节点的值,往树的右边走
if (cur->_kv.first < kv.first)
{
parent = cur;
cur = cur->_right;
}
//小于的话往左走
else if (cur->_kv.first > kv.first)
{
parent = cur;
cur = cur->_left;
}
//相同的值不能再插入
else
{
return false;
}
}
//运行到这里就说明cur一定走到了nullptr
//此时的parent节点存储的是叶子结点
cur = new Node(kv);
//大于插入到右边小于插入到左边
if (parent->_kv.first < kv.first)
{
parent->_right = cur;
}
else
{
parent->_left = cur;
}
cur->_parent = parent;
//还需要更新平衡因子
while (parent)
{
//平衡因子=右子树高度-左子树的高度
if (cur == parent->_left)
parent->_bf--;
else
parent->_bf++;
//注意看上面写的更新停止条件,等于0了就说明左右子树高度相等
if (parent->_bf == 0)
break;
else if (parent->_bf == 1 || parent->_bf == -1)
{
cur = parent;
parent = parent->_parent;
}
else if (parent->_bf == -2 || parent->_bf == 2)
{
//这里需要旋转处理,后面说
break;
}
else
{
//如果不是上面的几种情况,到这里就说明插入之前的树就有错误
assert(false);
}
}
return true;
}
private:
Node* _root = nullptr;
};
这里面还有一点关于旋转的功能没有实现。
下面介绍旋转的概念及如何实现
2.3旋转
2.3.1旋转的原则
1. 保持搜索树的规则
2. 让旋转的树从不满足变平衡,其次降低旋转树的高度 旋转总共分为四种,左单旋/右单旋/左右双旋/右左双旋。
2.3.2右单旋
• 本图1展示的是10为根的树,有a/b/c抽象为三棵高度为h的子树(h>=0),a/b/c均符合AVL树的要 求。10可能是整棵树的根,也可能是一个整棵树中局部的子树的根。这里a/b/c是高度为h的子树, 是⼀种概括抽象表示,他代表了所有右单旋的场景,实际右单旋形态有很多种。
• 在a子树中插入一个新结点,导致a子树的高度从h变成h+1,不断向上更新平衡因子,导致10的平 衡因子从-1变成-2,10为根的树左右高度差超过1,违反平衡规则。10为根的树左边太高了,需要 往右边旋转,控制两棵树的平衡。
• 旋转核心步骤,因为5<b子树的值<10,将b变成10的左子树,10变成5的右子树,5变成这棵树新 的根,符合搜索树的规则,控制了平衡,同时这棵的高度恢复到了插入之前的h+2,符合旋转原 则。如果插入之前10整棵树的一个局部子树,旋转后不会再影响上一层,插入结束了。
这张图是抽象的展示所有的右单旋的情况。
具体一点:
情况一: a,b,c三棵子树高度为0
情况二:a,b,c高度为1
情况三:a,b,c高度为2
注意b和c都有三种情况,插入的时候插入到a上可以有4种情况。
情况四,abc高度都为3
其实还有情况五,情况六等等,但是计算下去就没有什么意义了,介绍了前面的四种情况,我们就可以了解这个右单旋是什么情况了。接下来就是代码实现
2.3.3右单旋的代码实现
void RotateR(Node* parent)
{
Node* subL = parent->_left;//左子树
Node* subLR = subL->_right;//左子树的右子树
//注意修改父亲指针指向它左子树的右子树
parent->_left = subLR;
//判断一下如果左子树的右子树不为空的话,修改它的父亲指向
if (subLR)
subLR->_parent = parent;
//后面要修改父亲的指向,所以这里存一下
Node* parentParent = parent->_parent;
//把父亲节点放到左子树的右,同时改变父亲的父亲指针的指向
subL->_right = parent;
parent->_parent = subL;
// parent有可能是整棵树的根,也可能是局部的子树
// 如果是整棵树的根,要修改_root
// 如果是局部的指针要跟上一层链接
if (parentParent == nullptr)
{
_root = subL;
subL->_parent = nullptr;
}
else
{
//可能是左子树往上更改的
if (parent == parentParent->_left)
{
parentParent->_left = subL;
}
//也可能是右子树
else
{
parentParent->_right = subL;
}
subL->_parent = parentParent;
}
//完成上面的旋转后,根据我们上面画的图,平衡因子一定是0
parent->_bf = subL->_bf = 0;
}
2.3.4左单旋
• 本图6展示的是10为根的树,有a/b/c抽象为三棵高度为h的子树(h>=0),a/b/c均符合AVL树的要 求。10可能是整棵树的根,也可能是一个整棵树中局部的子树的根。这⾥a/b/c是高度为h的子树, 是一种概括抽象表示,他代表了所有左单旋的场景,实际左单旋形态有很多种,具体跟上面右旋类 似。
• 在a子树中插入一个新结点,导致a子树的高度从h变成h+1,不断向上更新平衡因子,导致10的平 衡因子从1变成2,10为根的树左右高度差超过1,违反平衡规则。10为根的树右边太高了,需要往 左边旋转,控制两棵树的平衡。
• 旋转核心步骤,因为10<b子树的值<15,将b变成10的右子树,10变成15的左子树,15变成这棵 树新的根,符合搜索树的规则,控制了平衡,同时这棵的高度恢复到了插入之前的h+2,符合旋转 原则。如果插入之前10整棵树的一个局部子树,旋转后不会再影响上一层,插入结束了。
2.3.5左单旋的代码实现
左单旋的实现实际就是右单旋逻辑的反向。
void RotateL(Node* parent)
{
Node* subR = parent->_right;//右子树
Node* subRL = parent->_right->_left;//右子树的左子树
//1、先改parent与subRL的关系
parent->_right = subRL;
if (subRL)
subRL->_parent = parent;
//记录父亲的父亲
Node* parentParent = parent->_parent;
//2、再修改subR与parent的关系
subR->_left = parent;
parent->_parent = subR;
//3、最后修改父亲的父亲和subR的关系,注意判断parent可能为根
if (parentParent == nullptr)
{
_root = subR;
subR->_parent = nullptr;
}
else
{
if (parentParent->_left == parent)
parentParent->_left = subR;
else
parentParent->_right = subR;
subR->_parent = parentParent;
}
parent->_bf = subR->_bf = 0;
}
2.3.6左右双旋
如图,左边高时,如果插入位置不是在a子树,而是插入在b子树,b子树高度从h变成h+1,引发旋转,右单旋无法解决问题,右单旋后,我们的树依旧不平衡。右单旋解决的纯粹的左边高,但是插入在b子树中,10为根的子树不再是单纯的左边高,对于10是左边高,但是对于5是右边高,需要用两次旋转才能解决,以5为旋转点进行一个左单旋,以10为旋转点进行一个右单旋,这棵树 这棵树就平衡了。
上面两张图分别为左右双旋中h==0和h==1具体场景分析,下面我们将a/b/c子树抽象为高度h的AVL 子树进行分析,另外我们需要把b子树的细节进一步展开为8和左子树高度为h-1的e和f子树,因为 我们要对b的父亲5为旋转点进行左单旋,左单旋需要动b树中的左子树。b子树中新增结点的位置 不同,平衡因子更新的细节也不同,通过观察8的平衡因子不同,这里我们要分三个场景讨论。
• 场景1:h>=1时,新增结点插入在e子树,e子树高度从h-1并为h并不断更新8->5->10平衡因子, 引发旋转,其中8的平衡因子为-1,旋转后8和5平衡因子为0,10平衡因子为1。
• 场景2:h>=1时,新增结点插入在f子树,f子树高度从h-1变为h并不断更新8->5->10平衡因子,引 发旋转,其中8的平衡因子为1,旋转后8和10平衡因子为0,5平衡因子为-1。
• 场景3:h==0时,a/b/c都是空树,b自己就是一个新增结点,不断更新5->10平衡因子,引发旋 转,其中8的平衡因子为0,旋转后8和10和5平衡因子均为0。
这里对于情景一,上面是直接一次把左单旋和右单旋一次画出来了,这里我细化了一下:
2.3.7左右双旋代码实现
左右单旋实际上就是左单旋和右单旋的组合,这里直接复用就行。
void RotateLR(Node* parent)
{
Node* subL = parent->_left;
Node* subLR = parent->_left->_right;
//记录插入后subLR的平衡因子,因为三种场景是固定的值,需要根据这里的平衡因子改变其他的平衡因子
int bf = subLR->_bf;
RotateL(parent->_left);//左单旋
RotateR(parent);//右单旋
if (bf == 0)//对应场景三
{
parent->_bf = 0;
subL->_bf = 0;
subLR->_bf = 0;
}
else if(bf == -1)//对应场景一
{
parent->_bf = 1;
subL->_bf = 0;
subLR->_bf = 0;
}
else if (bf == 1)//对应场景二
{
parent->_bf = 0;
subL->_bf = -1;
subLR->_bf = 0;
}
else
{
assert(false);
}
}
2.3.8右左双旋
• 场景1:h>=1时,新增结点插入在e子树,e子树高度从h-1变为h并不断更新12->15->10平衡因子,引发旋转,其中12的平衡因子为-1,旋转后10和12平衡因子为0,15平衡因子为1。
• 场景2:h>=1时,新增结点插入在f子树,f子树高度从h-1变为h并不断更新12->15->10平衡因子, 引发旋转,其中12的平衡因子为1,旋转后15和12平衡因子为0,10平衡因子为-1。
• 场景3:h==0时,a/b/c都是空树,b自己就是一个新增结点,不断更新15->10平衡因子,引发旋 转,其中12的平衡因子为0,旋转后10和12和15平衡因子均为0。
对于场景一我也是单独拿出来拆开画了一下:
2.3.9右左双旋的代码实现
同左右双旋:
void RotateRL(Node* parent)
{
Node* subR = parent->_right;
Node* subRL = parent->_right->_left;
//记录插入后subRL的平衡因子,因为三种场景是固定的值,需要根据这里的平衡因子改变其他的平衡因子
int bf = subRL->_bf;
RotateR(parent->_right);//右单旋
RotateL(parent);//左单旋
if (bf == 0)//对应场景三
{
parent->_bf = 0;
subR->_bf = 0;
subRL->_bf = 0;
}
else if (bf == -1)//对应场景一
{
parent->_bf = 0;
subR->_bf = 1;
subRL->_bf = 0;
}
else if (bf == 1)//对应场景二
{
parent->_bf = -1;
subR->_bf = 0;
subRL->_bf = 0;
}
else
{
assert(false);
}
}
2.4AVL树的查找
拿二叉搜索树逻辑实现即可,搜索效率为O(logN)
Node* find(const K& key)
{
Node* cur = _root;
while (cur)
{
if (cur->_kv.first < key)
{
cur = cur->_right;
}
else if (cur->_kv.first > key)
{
cur = cur->_left;
}
else
{
return cur;
}
}
return nullptr;
}
2.5AVL树平衡检测
int _height(Node* node)
{
if (node == nullptr)
{
return 0;
}
int LeftHeight = _height(node->_left);
int RightHeight = _height(node->_right);
return LeftHeight > RightHeight ? LeftHeight + 1 : RightHeight + 1;
}
bool IsBlanceTree(Node* root)
{
if (root == nullptr)
{
return true;
}
int LeftHeight = _height(root->_left);
int RightHeight = _height(root->_right);
int diff = RightHeight - LeftHeight;
if (abs(diff) >= 2)
{
cout << root->_kv.first << "高度差异常" << endl;
return false;
}
if (root->_bf != diff)
{
cout << root->_kv.first << "平衡因子异常" << endl;
return false;
}
// root的左和右如果都是AVL树,则该树一定是AVL树
return _IsBalanceTree(root->_left) && _IsBalanceTree(root->_right);
}
2.6补全insert
bool Insert(const pair<K, V>& kv)
{
if (_root == nullptr)
{
_root = new Node(kv);
return true;
}
Node* parent = nullptr;
Node* cur = _root;
//while循环找到需要插入节点的位置
while (cur)
{
//插入的值大于节点的值,往树的右边走
if (cur->_kv.first < kv.first)
{
parent = cur;
cur = cur->_right;
}
//小于的话往左走
else if (cur->_kv.first > kv.first)
{
parent = cur;
cur = cur->_left;
}
//相同的值不能再插入
else
{
return false;
}
}
//运行到这里就说明cur一定走到了nullptr
//此时的parent节点存储的是叶子结点
cur = new Node(kv);
//大于插入到右边小于插入到左边
if (parent->_kv.first < kv.first)
{
parent->_right = cur;
}
else
{
parent->_left = cur;
}
cur->_parent = parent;
//还需要更新平衡因子
while (parent)
{
//平衡因子=右子树高度-左子树的高度
if (cur == parent->_left)
parent->_bf--;
else
parent->_bf++;
//注意看上面写的更新停止条件,等于0了就说明左右子树高度相等
if (parent->_bf == 0)
break;
else if (parent->_bf == 1 || parent->_bf == -1)
{
cur = parent;
parent = parent->_parent;
}
else if (parent->_bf == -2 || parent->_bf == 2)
{
//这里需要旋转处理,后面说
if (parent->_bf == -2 && cur->_bf == -1)
{
RotateR(parent);
}
else if (parent->_bf == 2 && cur->_bf == 1)
{
RotateL(parent);
}
else if (parent->_bf == -2 && cur->_bf == 1)
{
RotateLR(parent);
}
else if (parent->_bf == 2 && cur->_bf == -1)
{
RotateRL(parent);
}
else
{
assert(false);
}
break;
}
else
{
//如果不是上面的几种情况,到这里就说明插入之前的树就有错误
assert(false);
}
}
return true;
}