【C++之STL】摸清 string 的模拟实现(上)

文章目录

  • 1. 为什么要模拟实现?
  • 2. 基本框架搭建
  • 3. 构造函数
    • 3. 1 默认构造/from c_str
    • 3. 2 拷贝构造
      • 3. 2. 1 深浅拷贝
    • 3. 3 fill
    • 3. 4 迭代器区间构造
  • 4. 容量操作
    • 4. 1 `size()`和`capacity()`和`empty()`
    • 4. 2 `clear()`
    • 4. 3 `resize()`
    • 4. 4 `reserve()`


1. 为什么要模拟实现?

可能有人觉得STL既然已经提供了功能如此丰富的string类,就没有必要再学习它的底层,但这显然是错误的看法。
原因有2:

  1. 找工作时面试官很喜欢让求职者回答STL一些容器的模拟实现的思路。
  2. 学习底层有助于巩固知识,还能帮助我们更好地理解这个容器,使用时能更加得心应手。

2. 基本框架搭建

首先,我们要实现一个string类,就不可避免地会和库中string冲突,这时就需要用到命名空间,将自己实现的这个类放进一个和std不同的命名空间中就能避免冲突。

string是对字符数组的封装,尽管一些编译器在具体实现时会加上一些其它的东西来进行优化,但我们先不考虑这些。这里我们实现的string类的成员变量就只有一个字符指针 char* _str;

string的实现可以模仿数据结构初阶中的顺序表,还要有_size_capacity两个成员变量。

另外,虽然字符串的长度可以用strlen这个库函数获取,但这个函数的时间复杂度是O(N),会导致代码效率降低,不如创建一个变量存储起来。

这样我们就可以搭建出最基本的框架:

// 我们实现的 string 不是模板类,可以声明与定义分离。
namespace test
{
	class string
	{
	private:
		char* _str;
        size_t _capacity;
		size_t _size;
	};
}

当然这个基础和实际上的库中的string类是有差别的。

这是cplusplus上给出的string的定义:

typedef basic_string<char> string;

可以看到库中的 string 是对一个类模版basic_string指定类型char得到的,实际上这个类可以得到四个类:

stringString class (class )
wstringWide string (class )
u16string String of 16-bit characters (class )
u32string String of 32-bit characters (class )

也就是其他不同的字符类型,不是很常用,而且使用方式和string完全相同,就不介绍了。

除此之外,如果你使用的是VS2022编译器,在监视窗口也可以发现VS2022中除了这个字符指针之外还添加了一个16个字节大小Buf数组:

_Buf

当这个Buf数组存满之后,才会将数据转移到_Ptr中,然后进行可能的扩容操作,这是VS编译器独特(应该)的优化方式。

当然gcc下string的定义也不是我们像我们写的这样简单,它用到了写时拷贝,这一点在本文最后面会补充。

3. 构造函数

注:只会实现最常用的构造函数,其它的构造函数原理也差不多。

3. 1 默认构造/from c_str

在类和对象(中)中说过,我们应该显示地实现一个默认构造,最好是全缺省的,所以我们就实现一个全缺省的默认构造。

// string.h
string(const char* str="");

// string.c
// 声明与实现分离时,实现中不能写出缺省值
string::string(const char* str)
    :_capacity(strlen(str))
{
    // 初始化列表是按照类模版中变量声明的顺序走的,所以需要注意顺序。不如把其他放在函数体内初始化,防止出错
    // 当然,把 _size 和 _str 都在初始化列表初始化也是可以的,但是一定要注意顺序
    _size = _capacity;	
    _str = new char[_capacity + 1];
    // 这里一定要注意要把 str 的内容拷贝到 _str 中,千万不能 _str = str 完事
    strcpy(_str, str);
}

构造string对象的时候,不要让_strnullptr,不然可能会导致报错,不如直接初始化为""来得方便。

3. 2 拷贝构造

这样写可以吗?

//string::string(const string s);	// 会导致循环构造
string::string(string& s)
    :_size(s.size)
    , _capacity(s._capacity)
{
    _str = s._str;
}

这里就不得不提关于深浅拷贝的问题了。

3. 2. 1 深浅拷贝

  1. 浅拷贝:也称位拷贝,编译器只是将对象中的值(包括指针)直接拷贝过来。如果对象中有动态资源就会导致多个对象同时操作一个空间的内容。并且当一个对象销毁时就会将该资源释放掉,而此时另一些对象不知道该资源已经被释放,以为还有效,就会继续对资源进行操作,发生野指针访问。

  2. 如果一个类中涉及到资源的管理,其拷贝构造函数、赋值运算符重载以及析构函数必须要显式给出。并且一般情况都要用深拷贝方式实现。

像上面那样直接_str = s._str就是典型的浅拷贝。

如果要实现string的深拷贝,可以使用strcpy函数,将s._str中的数据挨个复制到_str中,这样_str就和s._str完全无关了。

因此拷贝构造要这么写:

string::string(const string& s)
    :_capacity(s._capacity)
    ,_size(s._size)
{
    // 记得申请空间
    _str = new char[_capacity + 1];
    strcpy(_str, s._str);
}

3. 3 fill

string::string(size_t n, char c)
    :_capacity(0)
    , _size(0)
{
    for (int i = 0; i < n; i++)
        push_back(c);
}

这里用到了push_back(),可以节省不必要的代码,体现了复用的思想。

3. 4 迭代器区间构造

在此之前,我们先讲一下怎么实现迭代器:

typedef char* iterator;	//切记迭代器必须是这个名字!!!

现代编译器中迭代器的实现远比这个复杂,但功能上并没有差异,并且早期的STL版本中随机迭代器string的迭代器就是随机迭代器,迭代器的其他种类以后介绍)就是这样的实现。

既然迭代器就是一个指针,那么使用它进行构造也就算不上难事了。

// 注意,迭代器的类型各不相同,要使用模板(尽管string的构造一般也只会使用string的迭代器)
template<class InputIterator>
string(InputIterator first, InputIterator end)
    :_str(nullptr)
    , _size(0)
    ,_capacity(0)	// 对成员变量进行初始化
{
    reserve(end - first);	// 先预留足够的空间,减少损耗
    while (first != end)
    {
        push_back(*first);	// 直接使用push_back(),减少重复的代码量,当然也可以不使用push_back()而是直接插入
        first++;
    }
}

这里要特别说明一下为什么用while (first != end)而不是while (first < end),因为迭代器不只有这一种类型,比如说链表也有迭代器,尽管说通过操作符重载也能实现和string的迭代器差不多的功能,但是链表的每个节点都是动态开辟的,而动态开辟的地址的大小是不确定的,所以first不一定小于end,为了兼容所有类型的迭代器,在需要对迭代器进行遍历操作时,我们统一都使用first != end作为循环的结束条件。

4. 容量操作

4. 1 size()capacity()empty()

前两个直接返回_size()_capacity就可以了。

size_t string::size()const
{
    return _size;
}

size_t string::capacity()const
{
    return _capacity;
}

empty()就是返回_size是否为0.

bool string::empty()const
{
    return _size == 0;
}

别忘了在函数名后面加上const来兼容不可修改的实例化对象。

4. 2 clear()

将有效字符全部删除,大小置为0。

其实直接修改_size的大小,并在第一位加上'\0'就可以了。

void string::clear()
{
    _size = 0;
    _str[0] = '\0';
}

4. 3 resize()

void resize(size_t n, char c = '\0');

resize()需要处理两种情况:

  1. 新的大小>原来的大小:用字符c填补,还要判断容量是否足够。
  2. 新的大小<=原来的大小:缩减字符串的大小到新的大小。
void string::resize(size_t n, char c)
{
    // 第一种情况
    if (n > _size)
    {
        // 判断是否需要扩容
        if (n + _size > _capacity)
        {
            // 扩容,因为我们的构造函数不会吧_capacity置为0,而是2或其他值,所以不用判空
            size_t newcapacity = n + _size > 2 * _capacity ? n + _size : 2 * _capacity;
            reserve(newcapacity);
            _capacity = newcapacity;
        }
		// 插入字符 c,使 _size == n
        for (size_t i = _size; i < n + _size; i++)
            _str[i] = c;
        // 添加'\0'
        _str[n + _size] = '\0';
        // 更新数组大小
        _size += n;
    }
    else
    {
       	// 这个和clear()很像,只是不是把大小置为0而是n
        _str[n] = '\0';
        _size = n;
    }
}

但是第一种情况的书写未免太过复杂,有没有办法简化?

后面我们写push_back()的时候就会发现,其实第一种情况和push_back()的代码是高度重合的,我们可以直接对push_back()进行复用,这是string现代写法,本文会有一章来介绍所谓的现代写法。

4. 4 reserve()

void reserve (size_t n = 0);

用于预留空间。

需要注意的是,reserve()在扩容时一般不是n给多少就扩容到多少,我们先来看这个代码:

#include<string>
#include<iostream>
using namespace std;
int main()
{
	string s("");
	int last = 0;
	int i = 0;
	while (last < 1000)
	{
		s.reserve(i++);
		if (s.capacity() != last)
		{
			last = s.capacity();
			cout << last << endl;
		}
	}
	return 0;
}

这个程序可以输出当string对象的容量变化时的新容量。

VS2022上的输出结果为:VS2022

devc++(5.11,gcc4.9.2)的输出结果为:devc++

可以发现reserve()在VS2022上是以1.5倍的大小进行扩容(第一扩容是二倍,因为第二章中提到的_Buf数组),只有当新的容量大于现在的容量的1.5倍,才会进行扩容操作。

而devc++是2倍扩容,但是会在一些情况下缩小容量。

为了简化,我们采用简化版的VS2022的实现。

  1. n<=_capacity

这个函数不会做任何举动。

  1. n>_capacity

如果 n <= 1.5 * _capacity,就直接扩容至1.5倍,如果n <= 1.5 * _capacity,就扩容至n

void string::reserve(size_t n)
{
    // 如果 n < _capacity 就不做任何操作
    if (n > _capacity)
    {
        int newcapacity = 0;
        // 如果 n <= 1.5 * _capacity,就直接扩容至1.5倍,如果 n <= 1.5 * _capacity ,就扩容至 n
        if (n < _capacity * 1.5)
            newcapacity = _capacity * 1.5;
        else
            newcapacity = n;
		// 创建新的字符指针,注意要动态开辟
        char* newstr = new char[newcapacity];
        // 拷贝数据
        strcpy(newstr, _str);
        // 释放原空间
        delete[] _str;
        // 修改成员变量
        _str = newstr;
        _capacity = newcapacity;
    }
}

剩余内容请看:(本文发布后3天内更新)
string模拟实现下

谢谢你的阅读,喜欢的话来个点赞收藏评论关注吧!
我会持续更新更多优质文章

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/916542.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【postman】怎么通过curl看请求报什么错

获取现成的curl方式&#xff1a; 1&#xff0c;拿别人给的curl 2&#xff0c;手机app界面通过charles抓包&#xff0c;点击接口复制curl 3&#xff0c;浏览器界面-开发者工具-选中接口复制curl 拿到curl之后打开postman&#xff0c;点击import&#xff0c;粘贴curl点击send&am…

【网页设计】CSS 高级技巧

目标 能够使用精灵图能够使用字体图标能够写出 CSS 三角能够写出常见的 CSS 用户界面样式能够说出常见的布局技巧 1. 精灵图 为什么需要精灵图&#xff1f;精灵图的使用精灵图课堂案例 1.1 为什么需要精灵图&#xff1f; 一个网页中往往会应用很多小的背景图像作为修饰&…

【JavaEE初阶 — 多线程】wait() notify()

1. 协调多个线程之间的执行先后顺序的方法介绍 由于线程之间是抢占式执行的&#xff0c;因此线程之间执行的先后顺序难以预知&#xff1b;但是实际开发中&#xff0c;有时候我们希望合理地协调多个线程之间的执行先后顺序。 拓展&#xff1a; wait() 和 sleep() 的区别 …

TypeORM在Node.js中的高级应用

&#x1f493; 博客主页&#xff1a;瑕疵的CSDN主页 &#x1f4dd; Gitee主页&#xff1a;瑕疵的gitee主页 ⏩ 文章专栏&#xff1a;《热点资讯》 TypeORM在Node.js中的高级应用 TypeORM在Node.js中的高级应用 TypeORM在Node.js中的高级应用 引言 TypeORM 基本概念 1. 实体&am…

[Mysql] Mysql的多表查询----多表关系(下)

4、操作 方式二&#xff1a;创建表之后设置外键约束 外键约束也可以在修改表时添加&#xff0c;但是添加外键约束的前提是&#xff1a;从表中外键列中的数据必须与主表中主键列中的数据一致或者是没有数据。 语法&#xff1a; alter table <从表名> add constr…

Ethernet 系列(9)-- 基础学习::ICMP

目录 1. 缩写词&#xff1a; 2. ICMP的目的&#xff1a; 2.1 什么是ICMP&#xff1a; 2.2 什么时候使用ICMP&#xff1a; 3. ICMP 头部&#xff1a; 4. ICMP 报文类型&#xff1a; 4.1 目标不可达&#xff1a; 4.2 重定向&#xff1a; 4.3 超时&#xff1a; 4.4 Ping…

【计算机视觉】FusionGAN

1. FusionGAN论文阅读 abreheret/FusionGAN: Pytorch implementation of "Generating a Fusion Image: One’s Identity and Another’s Shape" 1.1. WHY 在现实世界中,将对象或人物转换为期望的形状是一种常用技术,但现有的图像翻译方法在处理身份和形状时存在…

<项目代码>YOLOv8 瞳孔识别<目标检测>

YOLOv8是一种单阶段&#xff08;one-stage&#xff09;检测算法&#xff0c;它将目标检测问题转化为一个回归问题&#xff0c;能够在一次前向传播过程中同时完成目标的分类和定位任务。相较于两阶段检测算法&#xff08;如Faster R-CNN&#xff09;&#xff0c;YOLOv8具有更高的…

24/11/12 算法笔记<强化学习> 自注意力机制

自注意力机制&#xff08;Self-Attention Mechanism&#xff09;&#xff0c;也称为内部注意力机制&#xff0c;是一种在深度学习模型中&#xff0c;特别是在自然语言处理&#xff08;NLP&#xff09;和计算机视觉领域中广泛使用的机制。它允许模型在处理序列数据时&#xff0c…

前后端交互之动态列

一. 情景 在做项目时&#xff0c;有时候后会遇到后端使用了聚合函数&#xff0c;导致生成的对象的属性数量或数量不固定&#xff0c;因此无法建立一个与之对应的对象来向前端传递数据&#xff0c;这时可以采用NameDataListVO向前端传递数据。 Data Builder AllArgsConstructo…

k8s服务内容滚动升级以及常用命令介绍

查看K8S集群所有的节点信息 kubectl get nodes 删除K8S集群中某个特定节点 kubectl delete nodes/10.0.0.123 获取K8S集群命名空间 kubectl get namespace 获取K8S所有命名空间的那些部署 kubectl get deployment --all-namespaces 创建命名空间 web界面上看到的效果,但是…

【视觉SLAM】1-概述

读书笔记 文章目录 1. 经典视觉SLAM框架2. 数学表述2.1 运动方程2.2 观测方程2.3 问题抽象 1. 经典视觉SLAM框架 传感器信息读取&#xff1a;相机图像、IMU等多源数据&#xff1b;前端视觉里程计&#xff08;Visual Odometry&#xff0c;VO&#xff09;&#xff1a;估计相机的相…

低成本出租屋5G CPE解决方案:ZX7981PG/ZX7981PM WIFI6千兆高速网络

刚搬进新租的房子&#xff0c;没有网络&#xff0c;开个热点&#xff1f;续航不太行。随身WIFI&#xff1f;大多是百兆级网络。找人拉宽带&#xff1f;太麻烦&#xff0c;退租的时候也不能带着走。5G CPE倒是个不错的选择&#xff0c;插入SIM卡就能直接连接5G网络&#xff0c;千…

如何在Typora中绘制流程图

如何在Typora中绘制流程图 在撰写文档时&#xff0c;清晰的流程图能极大地提升信息传递的效率。Typora是一款优秀的Markdown编辑器&#xff0c;支持通过Mermaid语法快速绘制流程图。本文将介绍如何在Typora中创建和自定义流程图&#xff0c;帮助你用更直观的方式呈现逻辑结构和…

莱特币转型MEME币:背后隐含的加密市场现象

随着加密市场的风云变幻&#xff0c;莱特币&#xff08;LTC&#xff09;这款曾经的“老牌矿币”近日以自嘲式推文宣布“自己是一个MEME币”&#xff0c;迅速引发了市场的广泛关注和一波围绕MEME币的炒作浪潮。这一举动看似玩笑&#xff0c;却反映出当前加密市场的一种微妙转变&…

【代码大模型】Is Your Code Generated by ChatGPT Really Correct?论文阅读

Is Your Code Generated by ChatGPT Really Correct? Rigorous Evaluation of Large Language Models for Code Generation key word: evaluation framework, LLM-synthesized code, benchmark 论文&#xff1a;https://arxiv.org/pdf/2305.01210.pdf 代码&#xff1a;https:…

LC12:双指针

文章目录 125. 验证回文串 本专栏记录以后刷题碰到的有关双指针的题目。 125. 验证回文串 题目链接&#xff1a;125. 验证回文串 这是一个简单题目&#xff0c;但条件判断自己写的时候写的过于繁杂。后面参考别人写的代码&#xff0c;首先先将字符串s利用s.toLowerCase()将其…

MySQL5.7.37安装配置

1.下载MySQL软件包并解压 2.配置环境变量 3.新建my.ini文件并输入信息 [mysqld] #端口号 port 3306 #mysql-5.7.27-winx64的路径 basedirC:\mysql-5.7.37\mysql-5.7.37-winx64 #mysql-5.7.27-winx64的路径\data datadirC:\mysql-5.7.37\mysql-5.7.37-winx64\data #最大连接数…

python习题4

1 判断车牌归属地 输入一串车牌号&#xff0c;按e结束&#xff0c;判断车牌归属于那里 例如&#xff1a; 输入&#xff1a; jingA12345 huB34567 zheA99999 e 输出&#xff1a; jing hu zhe chepai input(请输入车牌号&#xff1a;\n) lst [] while chepai ! e:lst…

【原创】java+ssm+mysql社区疫情防控管理系统设计与实现

个人主页&#xff1a;程序猿小小杨 个人简介&#xff1a;从事开发多年&#xff0c;Java、Php、Python、前端开发均有涉猎 博客内容&#xff1a;Java项目实战、项目演示、技术分享 文末有作者名片&#xff0c;希望和大家一起共同进步&#xff0c;你只管努力&#xff0c;剩下的交…