前言:map和set是C++里面的两种常用STL容器,他们被设计为关联式容器,这两个容器存储的元素都是唯一的,并且每个元素与键(key)相关联,简单来说就是两个存储不重复元素的容器。那就有人有疑问了,我们已经有了vector和list等容器了,为什么还要这两个容器呢?这个问题算是问到点子上了,假设一个场景,我们已经插入了很多个元素,我们突然需要找到这个元素的位置,我们该怎么办,如果是vector等容器,我们一般就会遍历,这样子的查找效率是O(N),有没有办法降低查找效率呢?当然有,就是把元素存储在map或者set里面,它们底层是平衡搜索树,查找效率在logN到2logN之间,是不是快了很多,在很多查找需求频繁的场景是不是很实用?
目录
一,set
1)set的使用
2)set的原理
3)二叉排序树
4)二叉平衡树(AVL)
1)右单旋
2)左单旋
3)左单旋加右单旋。
4)右单旋加左单旋
5)set如何实现的
二,map
1)map的内部构造
2)map成员函数
三,multiset与multimap
1)介绍
一,set
1)set的使用
先看一张来自C++官网关于set的介绍
其中的T是指key,也就是你插入的元素,compare是比较函数,允许自定义,如果不自定义的话,默认升序,Alloc是内存池开辟空间。
再看看构造函数
可以看到有两种构造方法,第一种是插入一个元素,也是图中最后一行,中间的是迭代器构造。
现在我们来看一个具体的例子。
vector<string> v={"hello","word"};
string s="hello";
set<string> s(v.begin(),v.end());
set<string> s1(s);
当然set也支持很多操作,有很多的成员函数
由于这里面的内容够多,并且与我以前的博客有较大重叠,因此这里不做详细讲解,但这里提供官网,想要仔细了解可以前往官网,如果不会阅读的话可以看我往期博客,里面介绍了如何阅读官网英文文档
set - C++ Referencehttps://legacy.cplusplus.com/reference/set/set/?kw=set
2)set的原理
我之前说了,set底层是平衡搜索二叉树(红黑树),我们在这里给大家介绍一下,平衡二叉树在这里的工作原理。
3)二叉排序树
首先我们要了解,二叉排序树:
二叉搜索树又称二叉排序树,它或者是一棵空树,或者是具有以下性质的二叉树:
若它的左子树不为空,则左子树上所有节点的值都小于根节点的值
若它的右子树不为空,则右子树上所有节点的值都大于根节点的值
它的左右子树也分别为二叉搜索树
当达到这些原则的时候,我们在二叉排序树里面查找某个元素是很快的,每次我们都能排出另一个结点及其以下的所有结点不包含我们想要的结果。
4)二叉平衡树(AVL)
但是也存在缺点,树的形状很大程度上影响了我们的查找效率,例如下图
当树的形状变成这样子,我们查找元素就和遍历没多大差距了,那怎么办呢?这时候平衡二叉树就横空出世了,我们在每棵树上加一个平衡因子,也就是类似一个整形,用来干嘛呢?平衡因子来记录左右子树的高度差,当高度差大于2的时候就需要我们来调整了。那我们该怎么调整呢?
1)右单旋
我们来看第一种情况。(我们是边插入边调整,当平衡因子绝对值等于2的时候开始解决不平衡问题)
注:h为未知数,节点上方的数字是平衡因子,这是把某种情况具体抽象出来了,60并不一定是根节点
在这种情况下,平衡因子因为插入的新结点而变的不平衡了,我们该怎么调整呢?
解决方案就是右单璇,60的左指针指向30的右孩子,30的右指针则指向60,然后把原本60父亲结点指向60的指针改为指向30,便完美解决了。(注意不要访问空指针)
但是这个有前提条件,首先最开始的60结点的平衡因子要是-2,而且60左孩子结点的平衡因子要是-1。那如果是1呢?这个就比较麻烦了我们放在最后面讲。
2)左单旋
现在我们继续看另一种情况
这个时候我们要作出与右单旋方法,相反的旋转方法,左单旋。
我们将30左指针由指向60改为指向60的左孩子结点,60的右指针指向30,再将原本30父亲指向它的指针改为指向60。
前提条件,平衡因子为2,并且右孩子的平衡因子为1。
3)左单旋加右单旋。
刚刚细心的人已经发现了,我们还有两种情况,平衡因子还有两种情况,本身平衡因子为-2,但左孩子结点平衡因子为1。这种情况我们还能不能单纯的右旋吗?
这样子我们会发现我们旋转了个寂寞。那该怎么办呢?
我们首先要将这个30再细分一下
这个时候我们先把30进行一个左单旋
很多人这时候可能问,假如是新插入结点的位置的c呢?我的回答是毫不影响,因为c高度就算是h,c这边的子树也不可能比a高,这个时候我们就把树调整为了上面讲的第一种情况,我们这个时候就可以不看30了,我们来看60,把60进行右单选得到平衡二叉树。
4)右单旋加左单旋
还有最后一种情况
相信认真听了前面的老铁已经发现了解决方法,没错就是右单旋加左单旋
5)set如何实现的
set的底层就是类似于平衡搜索二叉树,每次插入元素都会对树的形状进行排序和调整,那如果利用迭代器遍历的时候它是怎么得到我们想要的顺序呢?当然是中序啦,大家仔细分析中序就是有序。很多人又有疑问,那迭代器++是什么情况,它们的的地址是不连续的,这个是因为set的底层对这些运算符重载了,大家对这个有兴趣可以看我往期的STL之List的那篇文章,我在那里详细讲了。
二,map
1)map的内部构造
map和set的原理差不多,底层但是平衡搜索树,但是map是KV型容器,也就是通过某一个值key来找到value这个值,举个例子。
在学校食堂吃饭的时候,我们需要通过校园卡来付费,在我们把卡放在付款机上面的时候,首先它们会通过查找我们的姓名,学号等信息来判断我们是不是学生,卡了有没有足够的钱,而这些信息就是key,通过key查找到我们的余额,并且扣费,这是目的,也就是value。
key其一个帮助查找的工具,value才是目的,当然也不是绝对的,可以根据我们的需求来使用。那如何使用呢?
首先我来看函数参数
除了T代表value,其他应该不需要我介绍吧
直接快进到构造函数
同样有两种构造方法和直接自定义compare函数和内存池。图中最后一行不要以为是一个参数,实际是有两个参数(key,value),之所以之显示一个参数,是因为被pair包装起来了,pair是什么呢?
pair是库里面的一个容器,T1代表key,key不可修改,T2代表value,允许修改。
再看看pair里面的构造
成员变量有first和second分别代表key和value。
另一种方法就是我们熟悉的迭代器了,要注意map迭代器返回的是pair,pair里面包括key和value
map<string,string> m({"apple","苹果"});//隐式构造
m.insert(make_pair("string","字符"));//make_pair库函数构造
map<string,string> m1(m.begin(),m.end());//迭代器构造
for(auto e:m)
cout<<m.first<<":"<<m.second<<endl;//注意迭代器直接解引用并不是值,而是pair
2)map成员函数
这里都是构造函数,析构函数,拷贝构造函数,迭代器
这里面我们重点讲一下,【】运算符重载。先来看底层代码
它实际很简单,它调用了insert函数,为什么呢?因为insert不仅只有插入的作用,还有查找的功能,如果已经存在,它就会返回找到的结点,如果没有就会插入一个,然后访问second并返回它的引用就达到了我们想要的效果,是不是很妙。
3)map的原理
它的原理与set一样,底层同样是红黑树,大家可以参考上面的set。
三,multiset与multimap
1)介绍
multiset,multimap与set,map的差别在允不允许有重复元素,在前面我们说了map和set不能用于重复元素,如果insert重复元素就不会插入,而是会返回已经存在的元素,[]运算符重载就利用了这个特点。而multiset与·multimap是支持有重复元素,我给大家画一个有重复元素的图,方便大家理解
只要中序是有序的,那么插入的元素就没问题。
2)map与set中迷惑成员函数?
大家有没有在前面map与set的成员函数图里面发现这个图,很多人会有疑问,map,set里面没有重复元素,这个统计元素个数的函数有什么用?其实count函数并不是为map与set准备的,而是为multiset与multimap准备的,因为multiset与multimap里面允许有重复元素。