【C++】:vector容器的底层模拟实现迭代器失效隐藏的浅拷贝

目录

  • 💡前言
  • 一,构造函数
    • 1 . 强制编译器生成默认构造
    • 2 . 拷贝构造
    • 3. 用迭代器区间初始化
    • 4. 用n个val值构造
    • 5. initializer_list 的构造
  • 二,析构函数
  • 三,关于迭代器
  • 四,有关数据个数与容量
  • 五,交换函数swap
  • 六,赋值拷贝
  • 七,[ ]运算符
  • 八,预留空间(扩容)
    • 8.1 使用memcpy拷贝问题(重点)
  • 九,尾插和尾删数据
  • 十,插入数据 insert
  • 十一,删除数据 erase
  • 十二,insert和erase的迭代器失效问题(重点)
    • 1. 什么是迭代器失效?
    • 2. insert 的迭代器失效
      • 2.1 insert 内部pos位置的失效
      • 2.2 insert 以后外部的实参失效
    • 3. erase 以后的迭代器失效

💡前言

上篇文章已经介绍了vector容器的基本使用vector容器的基本使用,这篇文章主要选择vector中一些核心的,基本的接口进行模拟实现。

注意:由于我们模拟实现时使用了类模板所以不建议进行文件分离,不然会产生链接错误所以我们把函数都写在.h文件中,在Test.cpp文件中进行测试

首先我们先给出vector类:

#include <assert.h>
#include <vector>
#include <iostream>
using namespace std;

template<class T>
class vector
{
public:
	// Vector的迭代器是一个原生指针
	typedef T* iterator;
	typedef T* const_iterator;
	
	//......
	
private:
	iterator _start = nullptr;//指向开始位置的指针
	iterator _finish = nullptr;//指向最后一个位置的下一个位置的指针
	iterator _end_of_storage = nullptr;//指向存储容量的尾
};

一,构造函数

在vector文档中,构造函数分为好几个类型,下面分别进行介绍:

1 . 强制编译器生成默认构造

无参构造

vector() = default;

2 . 拷贝构造

//v2(v1);
vector(const vector<T>& v)
{
	//提前预开空间,避免边尾插边扩容
	reserve(v.capacity());

	for (auto e : v)
	{
		//this->push_back(e);
		push_back(e);
	}
}

3. 用迭代器区间初始化

3.1 一个类模版的成员函数可以写成函数模版
3.2 若使用iterator做迭代器,会导致初始化的迭代器区间[first,last)只能是vector的迭代器,重新声明迭代器,迭代器区间[first,last)可以是任意容器的迭代器

template <class InputIterator>
vector(InputIterator first, InputIterator last)
{
	while (first != last)
	{
		push_back(*first);
		++first;
	}
}

4. 用n个val值构造

vector(size_t n, const T& val = T())
{
	reserve(n);

	for (size_t i = 0; i < n; i++)
	{
		push_back(val);
	}
}

vector(int n, const T& val = T())
{
	reserve(n);

	for (size_t i = 0; i < n; i++)
	{
		push_back(val);
	}
}

具体使用:

//初始化3个空
vector<string> v1(3);

//初始化为3个xx
vector<string> v2(3, "xx");

//初始化为3个1
vector<int> v3(3, 1);//err 非法的间接寻址.参数匹配问题
vector<int> v3(3u, 1);//ok

//如果非要这样传参数,就需要再重载一个构造
vector<int> v3(3, 1);

4.1 为什么要重载两个类似的构造

理论上将,提供了vector(size_t n, const T& value = T())之后vector(int n, const T& value = T())就不需要提供了,但是对于:vector< int > v(10, 5);
编译器在编译时,认为T已经被实例化为int,而10和5编译器会默认其为int类型, 就不会走vector(size_t n, const T& value = T())这个构造方法, 最终选择的是:vector(InputIterator first, InputIterator last)。因为编译器觉得区间构造两个参数类型一致,因此编译器就会InputIterator实例化为int,但是10和5根本不是一个区间,编译时就报错了,故需要增加该构造方法。

4.2 T()是什么

T()是缺省值,注意这里不能给0,因为T可能为自定义类型,当T为内置类型的时候,也ok。因为C++对内置类型进行了升级,也有构造,为了兼容模版。

5. initializer_list 的构造

5.1. C++11新增的类模板initializer_list,方便初始化
5.2. 它的内部其实有两个指针一个指向第一个值的位置,一个指向最后一个值的下一个位置,并且支持迭代器

vector(initializer_list<T> il)
{
	reserve(il.size());

	for (auto e:il)
	{
		push_back(e);
	}
}

具体使用:
支持被花括号括起的任意个数的值给 initializer_list

auto il1 = { 1,3,4,5,6,7 };
initializer_list<int> il2 = { 1,2,3 };

//这里的隐式类型转换不一样,参数个数不固定
vector<int> v4 = { 7,8,9,4,5 };//隐式类型转换
vector<int> v5({ 4,5,6 });//直接构造

在这里插入图片描述

二,析构函数

~vector()
{
	if (_start)
	{
		delete[] _start;
		_start = _finish = _end_of_storage = nullptr;
	}
}

三,关于迭代器

iterator begin()
{
	return _start;
}

iterator end()
{
	return _finish;
}

const_iterator begin()const
{
	return _start;
}

const_iterator end()const
{
	return _finish;
}

四,有关数据个数与容量

//计算有效数据个数
size_t size()const
{
	return _finish - _start;
}

//计算当前容量
size_t capacity()const
{
	return _end_of_storage - _start;
}

五,交换函数swap

与string类类似,依然调用库里的swap函数,进行指针的交换。

void swap(vector<T>& v)
{
	std::swap(_start, v._start);
	std::swap(_finish, v._finish);
	std::swap(_end_of_storage, v._end_of_storage);
}

六,赋值拷贝

与string类的现代写法相同。

//赋值拷贝
//v3 = v1;
vector<T>& operator=(const vector<T> v)
{
	swap(v);
	return *this;
}

七,[ ]运算符

//[]运算符
T& operator[](size_t pos)
{
	//断言,避免下标越界
	assert(pos < size());

	return _start[pos];
}

八,预留空间(扩容)

void reserve(size_t n)
{
	//由于开空间后_start指向改变,所以要提前记录原来的有效数据个数
	//以便在新空间中更新_finish的位置
	size_t  old_size = size();

	if (n > capacity())
	{
		T* tmp = new T[n];//开新空间

		if (_start)
		{
			//memcpy(tmp, _start, sizeof(T) * old_size);
			for (size_t i = 0; i < old_size; i++)
			{
				//此时这里的赋值调用的是string的赋值,肯定是深拷贝
				tmp[i] = _start[i];
			}

			delete[] _start;//释放旧空间
		}

		_start = tmp;//改变指向,指向新空间

		//在新空间里更新_finish,_end_of_storage的位置
		_finish = _start + old_size;
		_end_of_storage = _start + n;
	}
}

8.1 使用memcpy拷贝问题(重点)

假设模拟实现的vector中的reserve接口中,使用memcpy进行的拷贝,以下代码会发生什么问题?

int main()
{
	 bite::vector<bite::string> v;
	 v.push_back("2222");
	 v.push_back("2222");
	 v.push_back("2222");
 
 	return 0;
}

问题分析:
(1) memcpy是内存的二进制格式拷贝,按字节拷贝将一段内存空间中内容原封不动的拷贝到另外一段内存空间中
(2) 如果拷贝的是自定义类型的元素,memcpy既高效又不会出错,但如果拷贝的是自定义类型元素,并且自定义类型元素中涉及到资源管理时,就会出错,因为memcpy的拷贝实际是浅拷贝

图解如下:

当把原空间里的"2222"拷贝进新空间后,delete会先对原空间的每个对象调用析构函数,再把原空间销毁,但是此时tmp仍指向那块空间,变成野指针了

在这里插入图片描述

复用赋值进行修改后

此时这里的赋值调用的是string的赋值,肯定是深拷贝

在这里插入图片描述

九,尾插和尾删数据

//尾插数据
void push_back(const T& x)
{
	if (_finish == _end_of_storage)
	{
		size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
		reserve(newcapacity);
	}

	*_finish = x;
	++_finish;
}

//尾删
void pop_back()
{
	//断言,确保有数据可删
	assert(size() > 0);
	--_finish;
}

十,插入数据 insert

//void insert(iterator pos, const T& x)
iterator insert(iterator pos, const T& x)
{
	//断言,判断下标的有效性
	assert(pos >= _start && pos <= _finish);

	//判断是否扩容
	if (_finish == _end_of_storage)
	{
		size_t len = pos - _start;

		size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
		reserve(newcapacity);

		//insert函数的内部迭代器失效问题:类似于野指针问题
		//扩容后pos位置失效,需要重新计算pos
		pos = _start + len;
	}
	//挪动数据再插入
	iterator end = _finish - 1;
	while (end >= pos)
	{
		*(end + 1) = *end;
		--end;
	}

	*(end + 1) = x;
	++_finish;

	//返回新插入那个位置的迭代器
	return pos;
}

十一,删除数据 erase

iterator erase(iterator pos)
{
	assert(pos >= _start && pos < _finish);

	iterator end = pos + 1;
	while (end != _finish)
	{
		*(end - 1) = *end;
		++end;
	}
	--_finish;

	//返回删除位置的下一个位置的迭代器
	return pos;
}

十二,insert和erase的迭代器失效问题(重点)

1. 什么是迭代器失效?

迭代器的主要作用就是让算法能够不用关心底层数据结构,其底层实际就是一个指针,或者是对指针进行了封装,比如:vector的迭代器就是原生态指针T* 。因此迭代器失效,实际就是迭代器底层对应指针所指向的空间被销毁了,而使用一块已经被释放的空间,造成的后果是程序崩溃(即如果继续使用已经失效的迭代器,程序可能会崩溃)。

2. insert 的迭代器失效

2.1 insert 内部pos位置的失效

当刚好执行了扩容操作这一步时,由于要开辟新空间,拷贝数据,释放空间,改变空间指向。但是此时pos位置还在原空间,这就使pos变成了野指针,如果对该位置进行访问,就会导致程序崩溃

所以在函数内部,扩容后我们要更新pos迭代器

在这里插入图片描述

2.2 insert 以后外部的实参失效

演示代码如下

void vector_test2()
{
	vector<int> v1;
	v1.push_back(1);
	v1.push_back(2);
	v1.push_back(3);
	v1.push_back(4);

	for (size_t i = 0; i < v1.size(); i++)
	{
		cout << v1[i] << " ";
	}
	cout << endl;

	//输入x,查找是否存在,如果存在,在该位置前插入10
	int x;
	cin >> x;
	vector<int>::iterator it = find(v1.begin(), v1.end(), x);
	
	//用返回值接收
	 it = v1.insert(it, 10);

	//建议失效后的迭代器不要访问,除非使用返回值。
	cout << *it << endl;

	for (size_t i = 0; i < v1.size(); i++)
	{
		cout << v1[i] << " ";
	}
	cout << endl;
}

insert以后it这个实参会不会失效呢?答案是:会的
在扩容的时候一定会导致迭代器失效。因为虽然在insert内部形参修正了,但是形参的改变不影响实参

在这里插入图片描述

迭代器失效的建议是:不要使用失效的迭代器

如果非要访问此时插入的那个位置,必须使用 insert 的返回值,返回的是新插入那个位置的迭代器
在这里插入图片描述

3. erase 以后的迭代器失效

erase 以后的迭代器失效问题比较复杂,它与平台相关。

代码演示如下

int main()
{
	 int a[] = { 1, 2, 3, 4 };
	 vector<int> v(a, a + sizeof(a) / sizeof(int));
	 
	 // 使用find查找3所在位置的iterator
	 vector<int>::iterator it = find(v.begin(), v.end(), 3);
	 
	 // 删除it位置的数据,导致it迭代器失效。
	 //v.erase(it); // err
	
	 it = v.erase(it); // ok
	 cout << *it<< endl; // 此处会导致非法访问
	 
	 return 0;
}

erase 以后it这个实参会不会失效呢?答案是:会的

erase删除pos位置元素后,it位置之后的元素会往前搬移,没有导致底层空间的改变,理论上讲迭代器不应该会失效,但是:如果it刚好是最后一个元素,删完之后it刚好是end的位置,而end位置是没有元素的,那么it就失效了或者说某个编译器有这样的机制:当删除到一定的数量时,会进行缩容处理,此时it也就相当于野指针了因此删除vector中任意位置上元素时,vs就认为该位置迭代器失效了

如果非要访问这个位置,也需要用返回值重新赋值!
在这里插入图片描述

以下代码的功能是删除vector中所有的偶数:

int main()
{
 vector<int> v{ 1, 2, 3, 4 };
 auto it = v.begin();
 
 while (it != v.end())
 {
	 if (*it % 2 == 0)
	 //v.erase(it); // err
	 it = v.erase(it); // ok
 
 	++it;
 }
 
 	return 0;
}

这个代码在VS平台下一定会运行崩溃!因为删除后it位置已经失效了,此时再对it进行访问(++操作或是解引用操作都是)会程序报错

但是在Linux下,g++编译器对迭代器失效的检测并不是非常严格,处理也没有vs下极端,所以正常运行

注意:

  • 与vector类似,string在插入+扩容操作+erase之后,迭代器也会失效,但是string的插入一般由下标控制,虽然也重载了迭代器版本,但是并不常用

综上所述,迭代器失效解决办法:在使用前,对迭代器重新赋值即可

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/660360.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

R语言入门 | 使用 ggplot2 进行数据可视化

1.0准备工作 先下好tidyverse包&#xff0c;并进行加载。 install.packages ( "tidyverse" ) library(tidyverse) R 包只需安装一次&#xff0c;但每次开始新会话时都要重新加载。 1.1 数据框 数据框是变量&#xff08;列&#xff09;和观测&#xff08;行&#x…

AppInventor2 表格布局的外面的黑框怎么去掉?

问&#xff1a;表格布局的外面的黑框怎么去掉啊&#xff1f; 答&#xff1a;这个黑框是界面设计的布局位置示意&#xff0c;实际 App 测试时并没有框。 来源&#xff1a;AppInventor2 表格布局的外面的黑框怎么去掉&#xff1f; - App应用开发 - 清泛IT社区&#xff0c;为创新…

【错题集-编程题】天使果冻(递推)

牛客对应题目链接&#xff1a;天使果冻 (nowcoder.com) 一、分析题目 预处理 递推 / 动态规划 f[i]&#xff1a;表示前 i 个数中的最大值。g[i]&#xff1a;表示前 i 个数中的第二大的值。 状态转移方程&#xff1a; f[i] max(f[i-1], arr[i]);arr[i] > f[i-1]&#xf…

数据结构(十)图

文章目录 图的简介图的定义图的结构图的分类无向图有向图带权图&#xff08;Wighted Graph&#xff09; 图的存储邻接矩阵&#xff08;Adjacency Matrix&#xff09;邻接表代码实现 图的遍历深度优先搜索&#xff08;DFS&#xff0c;Depth Fisrt Search&#xff09;遍历抖索过程…

电脑录屏怎么录?7个电脑录屏软件免费版强势来袭,赶快收藏!

电脑录屏怎么录&#xff1f;相信很多小伙伴们都不知道怎么在Windows电脑上录屏吧&#xff1f;在当今社会&#xff0c;随着互联网的快速发展&#xff0c;越来越多的小伙伴们开始通过制作视频内容来分享知识、展示技能或者记录生活。电脑录屏成为了一种简单高效的方式&#xff0c…

RocketMQ .NET

RocketMQ 是一款由阿里巴巴集团开发并开源给Apache软件基金会的分布式消息及流处理平台。以其高吞吐量、低延迟、高可用性等特点而广受欢迎。支持Java&#xff0c;C, Python, Go, .NET等。 异步解耦&#xff1a;可以实现上游和下游业务系统的松耦合设计&#xff0c;使得服务部…

markdown语法保存

这里写自定义目录标题 欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题&#xff0c;有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants 创建一个自定义列表如何创建一个…

React(四)memo、useCallback、useMemo Hook

目录 (一)memo API 1.先想一个情景 2.用法 (1)props传入普通数据类型的情况 (2)props传入对象的情况 (3)props传入函数的情况 (4)使用自定义比较函数 3.什么时候使用memo&#xff1f; (二)useMemo Hook 1.用法 2.useMemo实现组件记忆化 3.useMemo实现函数记忆化 …

dbserver 软件 展示 全部模式库

目录 1 问题2 实现 1 问题 dbserver 软件 展示 全部模式库 2 实现 以上就可以了

Vue——事件修饰符

文章目录 前言阻止默认事件 prevent阻止事件冒泡 stop 前言 在官方文档中对于事件修饰符有一个很好的说明&#xff0c;本篇文章主要记录验证测试的案例。 官方文档 事件修饰符 阻止默认事件 prevent 在js原生的语言中&#xff0c;可以根据标签本身的事件对象进行阻止默认事件…

从零到一建设数据中台 - 数据可视化

从零到一建设数据中台(八)- 数据可视化 一、数据可视化大屏 数据可视化是借助于图形化手段,清晰有效地传达与沟通信息。 将一些业务的关键指标通过数据可视化的方式展示到一块或多块LED大屏上,以大屏为主要展示载体的数据可视化设计。 在数据可视化大屏构建过程中,为了…

对红黑树、跳表、B+树的一些理解

文章目录 红黑树应用场景 跳表使用场景 B树使用场景 毫无疑问数据结构是复杂的&#xff0c;让人头大的&#xff0c;大学时唯一挂科的就是数据结构&#xff0c;上学时不用心&#xff0c;不晓得自己的职业生涯要一直被数据结构支配。 或多或少&#xff0c;面试抱佛脚时&#xff0…

如何做好投入式水位计的安装与维护

投入式水位计是一种广泛应用于各种环境和水位监测场景的精确测量设备。为了确保其长期稳定运行和测量准确性&#xff0c;正确的安装和维护至关重要。本文将详细介绍投入式水位计的安装步骤和注意事项&#xff0c;以及维护过程中的关键要点。 一、投入式水位计的安装 准备工作&a…

探索AI去衣技术中的反射应用

在当今数字时代&#xff0c;人工智能&#xff08;AI&#xff09;技术的飞速发展已经渗透到了我们生活的方方面面。其中&#xff0c;图像处理和计算机视觉作为AI的重要分支&#xff0c;正不断推动着创新应用的边界。今天&#xff0c;我们要探讨的是一个颇具争议但又技术上颇为有…

【2024最新华为OD-C卷试题汇总】披萨大作战 (100分) - 支持在线评测+三语言AC题解(Python/Java/Cpp)

&#x1f36d; 大家好这里是清隆学长 &#xff0c;一枚热爱算法的程序员 ✨ 本系列打算持续跟新华为OD-C卷的三语言AC题解 &#x1f4bb; ACM银牌&#x1f948;| 多次AK大厂笔试 &#xff5c; 编程一对一辅导 &#x1f44f; 感谢大家的订阅➕ 和 喜欢&#x1f497; 文章目录 前…

若依+vue框架使用字典下拉框回显错误

【版权所有&#xff0c;文章允许转载&#xff0c;但须以链接方式注明源地址&#xff0c;否则追究法律责任】【创作不易&#xff0c;点个赞就是对我最大的支持】 前言 仅作为学习笔记&#xff0c;供大家参考 总结的不错的话&#xff0c;记得点赞收藏关注哦&#xff01; 目录 …

面试:eureka、nacos、consul的区别

配置中心 配置中心eureka不支持nacos支持 用起来简单&#xff0c;符合springBoot的命名风格&#xff0c;支持动态刷新consul支持 但用起来偏麻烦&#xff0c;不太符合springBoot框架的命名风格&#xff0c;支持动态刷新 注册中心

电流继电器DL-13 柜内安装带板前接线附件 JOSEF约瑟

DL-10系列电流继电器板前接线为电磁式瞬动过电流继电器&#xff0c;它广泛用于电力系统二次回路继电保护装置线路中&#xff0c;作为过电流启动元件。 系列型号 DL-11电流继电器; DL-12电流继电器; DL-13电流继电器&#xff1b; 一、应用范围 DL-13/2电流继电器 板前接线为…

一文看懂!电磁仿真软件CST Studio Suite的技术发展历程

CST工作套件室是一款功能强大、专业级别的软件包&#xff0c;用于进行微波无源器件和天线的仿真分析和设计。它支持的应用领域包括耦合器、滤波器、环流器、隔离器、谐振腔、平面结构、连接器、电磁兼容、集成电路封装以及各种类型的天线和天线阵列。该软件可以提供必要的S参数…

polarctf靶场[reverse]shell、PE结构、拼接

[reverse]shell 考点&#xff1a;脱壳 将所解压的文件拖入DIE有无有壳&#xff0c;文件类型 发现有UPX壳&#xff0c;是32位的文件&#xff0c;先脱壳 用FFI工具脱壳 将脱壳后的程序用32位IDA进行反汇编 点开_main_0函数进行查看 看到flag&#xff0c;&#xff08;F5&#…