文章目录
- 关联式容器
- 键值对
- 树形结构与哈希结构
- set
- set的介绍
- set的使用
- set的模板参数列表
- set的构造
- set的使用
- set的迭代器
- 使用演示
- multiset
- multiset演示
- map
- map的定义方式
- map的插入
- map的查找
- map的[ ]运算符重载
- map的迭代器遍历
- multimap
- multimap的介绍
- multimap的使用
- 在OJ中的使用
- 前K个高频单词
- 两个数组的交集
关联式容器
C++STL包含了序列式容器和关联式容器:
- 序列式容器里面存储的是元素本身,其底层为线性序列的数据结构。比如:vector,list,deque,forward_list(C++11)等。
- 关联式容器里面存储的是<key, value>结构的键值对,在数据检索时比序列式容器效率更高。比如:set、map、unordered_set、unordered_map等。
注意: C++STL当中的stack、queue和priority_queue属于容器适配器,它们默认使用的基础容器分别是deque、deque和vector。
键值对
- 用来表示具有一一对应关系的一种结构,该结构中一般只包含两个成员变量key和value,key代表键值,value表示与key对应的信息。比如:现在要建立一个英汉互译的字典,那该字典中必然有英文单词与其对应的中文含义,而且,英文单词与其中文含义是一一对应的关系,即通过该应该单词,在词典中就可以找到与其对应的中文含义。
在SGI-STL中关于键值对的定义如下:
template <class T1, class T2>
struct pair
{
typedef T1 first_type;
typedef T2 second_type;
T1 first;
T2 second;
pair() : first(T1()), second(T2())
{}
pair(const T1& a, const T2& b) : first(a), second(b)
{}
};
树形结构与哈希结构
根据应用场景的不同,C++STL总共实现了两种不同结构的关联式容器:树型结构和哈希结构。
关联式容器 | 容器结构 | 底层实现 |
---|---|---|
set、map、multiset、multimap | 树型结构 | 平衡搜索树(红黑树) |
unordered_set、unordered_map、unordered_multiset、unordered_multimap | 哈希结构 | 哈希表 |
其中,树型结构容器中的元素是一个有序的序列,而哈希结构容器中的元素是一个无序的序列。
set
set的介绍
set文档介绍
翻译:
- set是按照一定次序存储元素的容器
- 在set中,元素的value也标识它(value就是key,类型为T),并且每个value必须是唯一的。set中的元素不能在容器中修改(元素总是const),但是可以从容器中插入或删除它们。
- 在内部,set中的元素总是按照其内部比较对象(类型比较)所指示的特定严格弱排序准则进行排序。
- set容器通过key访问单个元素的速度通常比unordered_set容器慢,但它们允许根据顺序对子集进行直接迭代。
- set在底层是用二叉搜索树(红黑树)实现的,所以在set当中查找某个元素的时间复杂度为 l o g 2 N log_2N log2N
注意:
- 与map/multimap不同,map/multimap中存储的是真正的键值对<key, value>,set中只放value,但在底层实际存放的是由<value, value>构成的键值对。
- set中插入元素时,只需要插入value即可,不需要构造键值对。
- set中的元素不可以重复(因此可以使用set进行去重)。
- 使用set的迭代器遍历set中的元素,可以得到有序序列
- set中的元素默认按照小于来比较
- set中查找某个元素,时间复杂度为: l o g 2 n log_2 n log2n
- set中的元素不允许修改(为什么?)
- set中的底层使用二叉搜索树(红黑树)来实现。
set的使用
set的模板参数列表
- T: set中存放元素的类型,实际在底层存储<value, value>的键值对。
- Compare:set中元素默认按照小于来比较
- Alloc:set中元素空间的管理方式,使用STL提供的空间配置器管理
set的构造
- 方式一: 构造一个某类型的空容器。
set<int> s1; //构造int类型的空容器
- 方式二: 拷贝构造某类型set容器的复制品。
set<int> s2(s1); //拷贝构造int类型s1容器的复制品
- 方式三: 使用迭代器拷贝构造某一段内容。
string str("abcdef");
set<char> s3(str.begin(), str.end()); //构造string对象某段区间的复制品
- 方式四: 构造一个某类型的空容器,比较方式指定为大于。
set < int, greater<int>> s4; //构造int类型的空容器,比较方式指定为大于
set的使用
成员函数 | 功能 |
---|---|
insert | 插入指定元素 |
erase | 删除指定元素 |
find | 查找指定元素 |
size | 获取容器中元素的个数 |
empty | 判断容器是否为空 |
clear | 清空容器 |
swap | 交换两个容器中的数据 |
count | 获取容器中指定元素值的元素个数 |
set的迭代器
成员函数 | 功能 |
---|---|
begin | 获取容器中第一个元素的正向迭代器 |
end | 获取容器中最后一个元素下一个位置的正向迭代器 |
rbegin | 获取容器中最后一个元素的反向迭代器 |
rend | 获取容器中第一个元素前一个位置的反向迭代器 |
使用演示
void test_set1()
{
set<int> s1;
s1.insert(1);
s1.insert(11);
s1.insert(3);
s1.insert(1);
s1.insert(4);
s1.insert(2);
set<int>::iterator it = s1.begin();
while (it != s1.end())
{
//*it = 1; // 不支持修改
cout << *it << " ";
++it;
}
cout << endl;
vector<int> v = { 3,2,8,1,10,2 };
set<int> s2(v.begin(), v.end());
for (auto e : s2)
{
cout << e << " ";
}
cout << endl;
set<int> s3 = { 3,2,8,1,10,2 };
for (auto e : s3)
{
cout << e << " ";
}
cout << endl;
s3.erase(8);
s3.erase(18);
for (auto e : s3)
{
cout << e << " ";
}
cout << endl;
auto pos = s3.find(10);
if (pos != s3.end())
{
cout << *pos << endl;
s3.erase(pos);
}
else
{
cout << "找不到" << endl;
}
for (auto e : s3)
{
cout << e << " ";
}
cout << endl;
}
void test_set2()
{
std::set<int> myset;
for (int i = 1; i < 10; i++)
myset.insert(i * 10); // 10 20 30 40 50 60 70 80 90
for (auto e : myset)
{
cout << e << " ";
}
cout << endl;
// [25,60)
auto itlow = myset.lower_bound(25); // >=val
auto itup = myset.upper_bound(60); // >val
myset.erase(itlow, itup);
for (auto e : myset)
{
cout << e << " ";
}
cout << endl;
auto ret = myset.equal_range(35);
std::cout << *ret.first << std::endl; // >=val
std::cout << *ret.second<< std::endl; // >val
}
multiset
multiset文档介绍
翻译:
- multiset是按照特定顺序存储元素的容器,其中元素是可以重复的。
- 在multiset中,元素的value也会识别它(因为multiset中本身存储的就是<value, value>组成的键值对,因此value本身就是key,key就是value,类型为T). multiset元素的值不能在容器
中进行修改(因为元素总是const的),但可以从容器中插入或删除。 - 在内部,multiset中的元素总是按照其内部比较规则(类型比较)所指示的特定严格弱排序准则进行排序。
- multiset容器通过key访问单个元素的速度通常比unordered_multiset容器慢,但当使用迭代器遍历时会得到一个有序序列。
- multiset底层结构为二叉搜索树(红黑树)。
注意:
- multiset中再底层中存储的是<value, value>的键值对
- mtltiset的插入接口中只需要插入即可
- 与set的区别是,multiset中的元素可以重复,set是中value是唯一的
- 使用迭代器对multiset中的元素进行遍历,可以得到有序的序列
- multiset中的元素不能修改
- 在multiset中找某个元素,时间复杂度为 O ( l o g 2 N ) O(log_2 N) O(log2N)
- multiset的作用:可以对元素进行排序
由于multiset容器允许键值冗余,因此两个容器中成员函数find和count的意义也有所不同:
成员函数find | 功能 |
---|---|
set对象 | 返回值为val的元素的迭代器 |
multiset对象 | 返回底层搜索树中序的第一个值为val的元素的迭代器 |
成员函数count | 功能 |
---|---|
set对象 | 值为val的元素存在则返回1,不存在则返回0(find成员函数可代替) |
multiset对象 | 返回值为val的元素个数(find成员函数不可代替) |
multiset演示
void test_set3()
{
// key模型搜索
// 排序 不去重,允许冗余
multiset<int> s1;
s1.insert(1);
s1.insert(11);
s1.insert(3);
s1.insert(1);
s1.insert(4);
s1.insert(2);
s1.insert(4);
s1.insert(2);
s1.insert(2);
s1.insert(2);
s1.insert(1);
s1.insert(2);
s1.insert(2);
s1.insert(1);
multiset<int>::iterator it = s1.begin();
while (it != s1.end())
{
//*it = 1;// 不能使用
cout << *it << " ";
++it;
}
cout << endl;
//auto pos = s1.find(2);
//while (pos != s1.end() && *pos == 2)
//{
// cout << *pos << " ";
// ++pos;
//}
// 删除所有的2
auto ret = s1.equal_range(2);
s1.erase(ret.first, ret.second);
// 还能统计删除了多少个2
size_t n = s1.erase(2); // 也可以这样直接删除
cout << n << endl;
for (auto e : s1)
{
cout << e << " ";
}
cout << endl;
// 统计有几个1
cout << s1.count(1) << endl;
}
map
map的文档简介
翻译:
- map是关联容器,它按照特定的次序(按照key来比较)存储由键值key和值value组合而成的元素。
- 在map中,键值key通常用于排序和惟一地标识元素,而值value中存储与此键值key关联的内容。键值key和值value的类型可能不同,并且在map的内部,key与value通过成员类型value_type绑定在一起,为其取别名称为pair:typedef pair<const key, T> value_type;
- 在内部,map中的元素总是按照键值key进行比较排序的。
- map中通过键值访问单个元素的速度通常比unordered_map容器慢,但map允许根据顺序
对元素进行直接迭代(即对map中的元素进行迭代时,可以得到一个有序的序列)。 - map支持下标访问符,即在[]中放入key,就可以找到与key对应的value。
- map通常被实现为二叉搜索树(更准确的说:平衡二叉搜索树(红黑树))。
注意:
- multiset中再底层中存储的是<value, value>的键值对
- mtltiset的插入接口中只需要插入即可
- 与set的区别是,multiset中的元素可以重复,set是中value是唯一的
- 使用迭代器对multiset中的元素进行遍历,可以得到有序的序列
- multiset中的元素不能修改
- 在multiset中找某个元素,时间复杂度为 O ( l o g 2 N ) O(log_2 N) O(log2N)
- multiset的作用:可以对元素进行排序
map的定义方式
- 方式一: 指定key和value的类型构造一个空容器。
map<int, double> m1; //构造一个key为int类型,value为double类型的空容器
- 方式二: 拷贝构造某同类型容器的复制品。
map<int, double> m2(m1); //拷贝构造key为int类型,value为double类型的m1容器的复制品
- 方式三: 使用迭代器拷贝构造某一段内容。
map<int, double> m3(m2.begin(), m2.end()); //使用迭代器拷贝构造m2容器某段区间的复制品
- 方式四: 指定key和value的类型构造一个空容器,key比较方式指定为大于。
map<int, double, greater<int>> m4; //构造一个key为int类型,value为double类型的空容器,key比较方式指定为大于
map的插入
- map的插入函数的函数原型如下:
pair<iterator,bool> insert (const value_type& val);
- insert函数的参数
insert函数的参数显示是value_type类型的,实际上value_type就是pair类型的别名:
typedef pair<const Key, T> value_type;
insert插入:
void test_map1()
{
map<string, string> dict;
dict.insert(pair<string, string>("sort", "排序"));
dict.insert(pair<string, string>("inster", "插入"));
dict.insert(pair<const char*, const char*>("left", "左"));
// 推荐
dict.insert(make_pair("right", "右"));
// 单参数类型支持 隐式类型转换
dict.insert({ "left", "左"});
string s1("xxx"), s2("yyy");
dict.insert(make_pair(s1, s2));
for (auto e : dict)
{
cout << e.first << " " << e.second << endl;
}
cout << endl;
}
- insert函数的返回值
insert函数的返回值也是一个pair对象,该pair对象中第一个成员的类型是map的迭代器类型,第二个成员的类型的一个bool类型,具体含义如下:
- 若待插入元素的键值key在map当中不存在,则insert函数插入成功,并返回插入后元素的迭代器和true。
- 若待插入元素的键值key在map当中已经存在,则insert函数插入失败,并返回map当中键值为key的元素的迭代器和false。
map的查找
- map的查找函数是根据所给key值在map当中进行查找,若找到了,则返回对应元素的迭代器,若未找到,则返回容器中最后一个元素下一个位置的正向迭代器。
void test_map3()
{
map<string, string> dict;
dict.insert(pair<string, string>("sort", "排序"));
dict.insert(pair<string, string>("inster", "插入"));
dict.insert(pair<const char*, const char*>("left", "左"));
dict.insert(make_pair("right", "右"));
string s1("xxx"), s2("yyy");
dict.insert(make_pair(s1, s2));
map<string, string>::iterator pos = dict.find("sort");
if (pos != dict.end())
{
cout << pos->second << endl;
}
}
map的[ ]运算符重载
- 我们之前的统计可以直接使用[]来统计
void test_map2()
{
std::string arr[] = { "苹果", "西瓜", "苹果", "西瓜", "苹果", "苹果", "西瓜","苹果", "香蕉", "苹果", "香蕉" };
map<string,int> countMap;
for (auto& str : arr)
{
//auto ret = countMap.find(str);
//if (ret == countMap.end())
//{
// countMap.insert(make_pair(str, 1));
//}
//else
//{
// ret->second++;
//}
// 一行完成统计
countMap[str]++;
}
for (auto& kv : countMap)
{
cout << kv.first << ":" << kv.second << endl;
}
}
- map的[ ]运算符重载函数的函数原型如下:
mapped_type& operator[] (const key_type& k);
- [ ]运算符重载函数的参数就是一个key值,而这个函数的返回值如下:
(*((this->insert(make_pair(k, mapped_type()))).first)).second
实际上[ ]运算符重载实现的逻辑实际上就是以下三个步骤:
- 调用insert函数插入键值对。
- 拿出从insert函数获取到的迭代器。
- 返回该迭代器位置元素的值value。
简写:
mapped_type& operator[] (const key_type& k)
{
//1、调用insert函数插入键值对
pair<iterator, bool> ret = insert(make_pair(k, mapped_type()));
//2、拿出从insert函数获取到的迭代器
iterator it = ret.first;
//3、返回该迭代器位置元素的值value
return it->second;
}
具体使用:
void test_map4()
{
map<string, string> dict;
dict.insert(pair<string, string>("sort", "排序"));
dict.insert(pair<string, string>("inster", "插入"));
dict.insert(pair<const char*, const char*>("left", "左"));
dict.insert(make_pair("right", "右"));
string s1("xxx"), s2("yyy");
dict.insert(make_pair(s1, s2));
dict["erase"]; // 插入
cout << dict["erase"] << endl; // 查找
dict["erase"] = "删除"; // 修改
dict["test"] = "测试"; // 插入+修改
dict["left"] = "左边、剩余"; // 修改
map<string, string>::iterator it = dict.begin();
while (it != dict.end())
{
cout << (*it).first << " " << (*it).second << endl;
++it;
}
}
如果k不在map中,则先插入键值对<k, V()>,然后返回该键值对中V对象的引用。
如果k已经在map中,则返回键值为k的元素对应的V对象的引用。
map的迭代器遍历
成员函数 | 功能 |
---|---|
begin | 获取容器中第一个元素的正向迭代器 |
end | 获取容器中最后一个元素下一个位置的正向迭代器 |
rbegin | 获取容器中最后一个元素的反向迭代器 |
rend | 获取容器中第一个元素前一个位置的反向迭代器 |
void test_map1()
{
map<string, string> dict;
dict.insert(pair<string, string>("sort", "排序"));
dict.insert(pair<string, string>("inster", "插入"));
dict.insert(pair<const char*, const char*>("left", "左"));
dict.insert(make_pair("right", "右"));
string s1("xxx"), s2("yyy");
dict.insert(make_pair(s1, s2));
// 1. 正向迭代器
map<string, string>::iterator it = dict.begin();
while (it != dict.end())
{
cout << (*it).first << " " << (*it).second << endl;
//cout << it->first << " " << it->second << endl;
//cout << it.operator->()->first << " " << it.operator->()->second << endl;
++it;
}
cout << endl;
// 2. 反向迭代器
map<string, string>::reverse_iterator rit = dict.rbegin();
while (rit != dict.rend())
{
cout << (*rit).first << " " << (*rit).second << endl;
++rit;
}
cout << endl;
// 3. auto
for (auto& e : dict)
{
// e.first += 'x'; // 不能修改
e.second += 'x'; // 可以修改
cout << e.first << " " << e.second << endl;
}
cout << endl;
}
multimap
multimap的介绍
multimap文档介绍
翻译:
- Multimaps是关联式容器,它按照特定的顺序,存储由key和value映射成的键值对<key,value>,其中多个键值对之间的key是可以重复的。
- 在multimap中,通常按照key排序和惟一地标识元素,而映射的value存储与key关联的内容。key和value的类型可能不同,通过multimap内部的成员类型value_type组合在一起,
value_type是组合key和value的键值对:typedef pair<const Key, T> value_type; - 在内部,multimap中的元素总是通过其内部比较对象,按照指定的特定严格弱排序标准对key进行排序的。
- multimap通过key访问单个元素的速度通常比unordered_multimap容器慢,但是使用迭代器直接遍历multimap中的元素可以得到关于key有序的序列。
- multimap在底层用二叉搜索树(红黑树)来实现。
注意:multimap和map的唯一不同就是:map中的key是唯一的,而multimap中key是可以重复的。
multimap的使用
multimap中的接口可以参考map,功能都是类似的。
注意:
- multimap中的key是可以重复的。
- multimap中的元素默认将key按照小于来比较
- multimap中没有重载operator[]操作。
- 使用时与map包含的头文件相同:
由于multimap容器允许键值冗余,调用[ ]运算符重载函数时,应该返回键值为key的哪一个元素的value的引用存在歧义,因此在multimap容器当中没有实现[ ]运算符重载函数
在OJ中的使用
前K个高频单词
OJ链接
- 首先我们先进行统计次数
- 然后再进行排序,排序的时候要自己手动控制,需要写一个仿函数(需要字典序小的在前面)
- 最后将前k个push_back到一个vector中后返回
class Solution {
public:
// 仿函数
struct kvcmp {
bool operator()(const pair<string, int>& kv1,
const pair<string, int>& kv2) {
return kv1.second > kv2.second ||
(kv1.second == kv2.second &&
kv1.first < kv2.first); // 字典序小的在前面
}
};
vector<string> topKFrequent(vector<string>& words, int k) {
// 统计次数
map<string, int> countMap;
for (auto& str : words) {
countMap[str]++;
}
// 排序
vector<pair<string, int>> Kv(countMap.begin(), countMap.end());
sort(Kv.begin(), Kv.end(), kvcmp()); // 通过仿函数排序(不稳定排序)
vector<string> v;
for (int i = 0; i < k; i++) {
v.push_back(Kv[i].first);
}
return v;
}
};
两个数组的交集
OJ链接
- 放到set(排序+去重)
找交集
- 相同就是交集,(同时++)
- 不相同(小的++)
找差集:
- 相等同时++
- 不相等(小的是差集)
- 一个结束,另一个没结束也是差集
找并集
- 直接放到set里
class Solution {
public:
vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {
// 去重+排序
set<int> s1(nums1.begin(), nums1.end());
set<int> s2(nums2.begin(), nums2.end());
// 依次比较,小的一定不是交集,相等的是交集
set<int>::iterator it1 = s1.begin(), it2 = s2.begin();
vector<int> ret;
while (it1 != s1.end() && it2 != s2.end()) {
if (*it1 < *it2)
++it1;
else if (*it1 > *it2)
++it2;
else {
ret.push_back(*it1);
++it1;
++it2;
}
}
return ret;
}
};