前言
string类一直都是C++的经典问题,之前的文章已经对string类做了一个基本的介绍(string类的基本常用接口),为了更好理解string类的功能,此篇文章将手把手教你带你手搓模拟实现string类,快来一起学习吧!!!
目录
一、 构造/析构/拷贝构造/赋值
1、 构造函数
1️⃣最初版本:
❓【问题】❓
🌟【解答】🌟
❓【问题】❓
🌟【解答】🌟
2️⃣改进版本:
3️⃣优化版本:
2、析构函数
3、拷贝构造函数
4、operator =
二、 遍历
1、operate[ ]
2、iterator
3、范围 for
三、比较
1、 operate >
2、operator ==
3、operator >=
4、operator <
5、operator <=
6、operator !=
四、增加
1、push_back
2、append
3、operator +=
4、insert
1)插入一个字符
2)插入一串字符
五、改操作
1、reserve
2、resize
3、erase
4、clean
5、swap
6、find
1)查找一个字符
2)查找字符串
六、流插入和流提取
1、流插入
2、流提取
七、完整代码
一、 构造/析构/拷贝构造/赋值
为了和标准库分开,我们可以将我们需要模拟实现的string类用另一个命名空间封装起来。
1、 构造函数
1️⃣最初版本:
我们很容易想到下面这种方式:
但是在运行过程中会出现一系列问题:
❓【问题】❓
不能直接把 str 赋值给 _str .
🌟【解答】🌟
在string类中,str 是被const修饰的,这是库里规定的,不能改变。给成员变量 char*_str 加上 const 可以暂时解决这个问题,但会使后期无法对字符串进行扩容。因此,解决方法是开辟一块新的空间,然后将 str 的数据拷贝到_str 中。
❓【问题】❓
无参构造函数运行错误
🌟【解答】🌟
打印 s1,会调用无参构造函数,cout 流插入是自动识别类型,识别为 const char*,他不是去打印这个指针,是打印这个字符串‘\0’之前的数字,就会对空指针进行解引用。因此,解决方法是不在_str 中放入空指针,而是开辟一个空间放入‘\0’;
2️⃣改进版本:
3️⃣优化版本:
利用构造函数的缺省值
2、析构函数
要与new[ ]对应用delete[ ]释放空间。
然后将指针置空,大小容量置0。
3、拷贝构造函数
系统会默认生成拷贝构造函数, 系统默认生成的浅拷贝,两个指向同一块空间,会导致两个问题:改变一个会影响另外一个;一块空间会被析构两次。因此我们需要深拷贝,开辟一块和原来一样大的空间,将数据拷贝过来。更多细节知识可以参考【拷贝构造函数】
4、operator =
赋值是两个已经存在的对象,将其中一个对象拷贝给另一个对象。从内存大小上看,有三种情况:两个对象的内存差不多大,直接可以将内容拷贝过去;赋值对象的内存比较大,直接将内容拷贝过去,但是可能造成空间的浪费;赋值对象的内存比较小,拷贝内容需要对其扩容。
因此,我们可以直接开辟一块跟要赋值对象s一样大的空间tmp,然后将赋值对象的值拷贝到tmp里。将被赋值对_str象的空间释放。最后将tmp赋给_str.将_str对象的大小和容量都与s对象一致。
二、 遍历
1、operate[ ]
需要两个版本,编译器可以自动识别。
2、iterator
iterator其实在string里来说本质上可以看成一个指针类型。我们在这里自己定义一个iterator。定义完iterator类型后,就可以写begin()和end()了。begin返回的是指向开头位置的迭代器,end返回的是指向最后一个字符的下一个位置。迭代器也需要分为const和非const版本。
3、范围 for
范围 for 遍历的底层逻辑是迭代器,因此定义迭代器之后可以直接使用。
【运行结果】
三、比较
1、 operate >
比较大小是依次比较字母的 ascll 码值。
2、operator ==
3、operator >=
4、operator <
5、operator <=
6、operator !=
四、增加
1、push_back
首先需要判断内存是否需要扩容,扩容可以自己修改,本文选择是两倍扩容。然后直接将字符放在最后,size++,不要忘记补上‘\0’;
2、append
首先需要判断内存是否需要扩容。然后将 str 字符串加在原字符串后面,strcpy 会把‘\0’ 一起拷贝过去,因此不需要单独加上。
3、operator +=
+= 的底层逻辑依旧是push_back 和 append。
4、insert
1)插入一个字符
首先需要判断内存大小;把pos后的字符从前往后挪一个,然后把指定字符放入 pos。最后更新size;需要注意头插,end容易产生越界的问题,本文采用的解决方案是把end往后移一位。
2)插入一串字符
五、改操作
1、reserve
功能是预留空间,主要用来扩容。当数据实际大小大于容量时,就要开始扩容。原理就是在异地开辟一块空间,多开一个字符用来存放 ‘\0’,然后将原字符拷贝过来,释放原空间。将空间和容量再次赋值给原字符串。
2、resize
resize 和 reserve 的区别就是 resize 会扩容之后初始化,如果规定初始化内容,是在原字符串的后面加上规定的初始化内容。改变的仅仅是size,capacity不会改变。resize n 有三种情况:
① n < size 直接删除数据,保留前n个
② size < n <capacity 向后插入n-size个字符
③ n > capacity 扩容 n,capacity 不变
3、erase
erase()删除某个位置len个字符,len给了缺省值npos,也就是不写长度时,默认从pos位置一直删除到尾。所以有两种情况:
①pos+len >= size ,删除pos后的所有值,直接将 pos 位置的值改成“\0”;
②pos+len< size时,把pos+len后面的值拷贝到pos后,然后调整size即可。
4、clean
只需要将第一个位置上修改成’\0’,大小修改成0.
5、swap
6、find
1)查找一个字符
find()可以从某个位置开始查找某个字符,返回改字符的位置。
首先需要判断pos位置是否合法。直接利用遍历从pos位置开始查找该字符ch,如果找到直接返回该下标,如果没有找到则返回npos。
2)查找字符串
返回该字符串的位置。 首先需要判断pos位置合法性,直接使用strstr来查找字符串,找到返回指向该字符起始位置的指针。指针-指针等于长度,所以p减去起始位置就是p的位置。
六、流插入和流提取
1、流插入
流插入cout,利用运算符<<重载,要注意这个函数不能写成成员函数,因为this指针会抢占左操作数,而左操作数应该是流插入cout。所以必须写在类外,不能写在类里。写在类外的话,想要访问类里的私有成员就得需要使用友元,而这里可以不需要使用友元就可以访问私有成员,那就是一个一个字符打印。
2、流提取
①cin和scanf当遇到空格或换行都会停止读取。
②本文使用get()函数,因为不管是换行还是空格都会读取。
③每次读取之前都需要将缓冲区内容清空,不然下一次读取就会将上一次的内容也读取下来。
④这里如果每次都读取一个字符会很麻烦,因为会不断的扩容,如果提取的字符很长,就会从小到大不断扩容。所以这里采取的是将提取的字符放入一个数组里,当提取部分或者全部提取之后再放进去。这样就可以减少扩容次数了。注意最后一位要放入’\0’.
七、完整代码
#define _CRT_SECURE_NO_WARNINGS
#pragma once
#include<assert.h>
#include<string>
namespace zhou
{
class string
{
public:
typedef char* iterator;
iterator begin()
{
return _str;
}
iterator end()
{
return _str+_size;
}
iterator begin() const
{
return _str;
}
iterator end() const
{
return _str + _size;
}
//无参的构造函数
/*string()
:_str(new char[1])
,_size(0)
,_capacity(0)
{
_str[0] = '\0';
}*/
//带参的构造函数
//str是被const修饰的,是库里面决定的,不能改变
//string(const char* str=nullptr) 不可以,strlen遇到'\0'才停止,遇到空指针会崩溃
//string(const char* str = '\0') 不可以,类型不匹配,左边是char类型的
//string(const char* str = "\0") //可以,是常量字符串,strlen是0,可以正常运算。
string(const char* str = "") //可以,不写默认是'\0'
:_size(strlen(str))
{
_capacity = _size;
_str = new char[_capacity + 1];
strcpy(_str, str);
}
//返回c形式的字符串
const char* c_str()
{
return _str;
}
string(const string& s)
:_size(s._size)
, _capacity(s._capacity)
{
_str = new char[s._capacity + 1];
strcpy(_str, s._str);
}
//无 const 修饰
char& operator[](size_t pos)
{
assert(pos < _size);
return _str[pos];
}
//有 const 修饰
const char& operator[](size_t pos) const
{
assert(pos < _size);
return _str[pos];
}
size_t size()
{
return _size;
}
//赋值
string& operator=(const string s)
{
if (this != &s)
{
char* tmp = new char[s._capacity + 1];
strcpy(tmp, s._str);
delete[]_str;
_str = tmp;
_size = s._size;
_capacity = s._capacity;
}
return *this;
}
//不修改成员变量数据的函数,最好都加上const
bool operator>(const string& s) const
{
return strcmp(_str, s._str) > 0;
}
bool operator==(const string& s) const
{
return strcmp(_str, s._str) == 0;
}
bool operator>=(const string& s) const
{
//return *this > s || *this == s;
return *this > s || s == *this;
}
bool operator<(const string& s) const
{
return !(*this >= s);
}
bool operator<=(const string& s) const
{
return !(*this > s);
}
bool operator!=(const string& s) const
{
return !(*this == s);
}
void reserve(size_t n)
{
if (n > _capacity)
{
char* tmp = new char[n + 1];
strcpy(tmp, _str);
delete[] _str;
_str = tmp;
_capacity = n;
}
}
void resize(size_t n, char ch = '\0')
{
if (n <= _size)
{
_size = n;
_str[_size] = '\0';
}
else
{
if (n > _capacity)
{
reserve(n);
}
size_t i = _size;
while (i < n)
{
_str[i] = ch;
i++;
}
_size = n;
_str[_size] = '\0';
}
}
void push_back(char ch)
{
//要判断内存
if (_size + 1 > _capacity)
{
reserve(2 * _capacity);
}
_str[_size] = ch;
_size++;
//不要忘'\0'
_str[_size] = '\0';
}
void append(const char* str)
{
size_t len = strlen(str);
if (_size + len > _capacity)
{
reserve(_size + len);
}
strcpy(_str + _size, str);
_size += len;
}
string& operator+=(char ch)
{
push_back(ch);
return *this;
}
string& operator+=(const char* str)
{
append(str);
return *this;
}
string& insert(size_t pos, char ch)
{
assert(pos <=_size);
if (_size + 1 > _capacity)
{
reserve(2 * _capacity);
}
//问题代码,会发现头插时会崩溃
/*size_t end = _size;
while (end >=pos)
{
_str[end + 1] = _str[end];
end--;
}*/
size_t end = _size + 1;
while (end > pos)
{
_str[end] = _str[end-1];
end--;
}
_str[pos] = ch;
_size++;
return *this;
}
string& insert(size_t pos, const char* str)
{
size_t len = strlen(str);
assert(pos <= _size);
if (_size + len > _capacity)
{
reserve(_size + len);
}
size_t end = _size + len;
while (end > pos + len-1)
{
_str[end] = _str[end-len];
end--;
}
strncpy(_str + pos, str,len);
_size += len;
return *this;
}
string& erase(size_t pos, size_t len = npos)
{
assert(pos < _size);
if (len == npos || pos + len >= _size)
{
_str[pos] = '\0';
_size = pos;
}
else
{
strcpy(_str + pos, _str + pos + len);
_size -= len;
}
return *this;
}
void swap(string& s)
{
std::swap(_str, s._str);
std::swap(_capacity, s._capacity);
std::swap(_size, s._size);
}
size_t find(char ch, size_t pos = 0)
{
assert(pos < _size);
for (size_t i = pos; i < _size; ++i)
{
if (_str[i] == ch)
{
return i;
}
}
return npos;
}
size_t find(const char* str, size_t pos = 0)
{
assert(pos < _size);
char* p = strstr(_str + pos, str);
if (p == nullptr)
{
return npos;
}
else
{
return p - _str;
}
}
void clear()
{
_str[0] = '\0';
_size = 0;
}
~string()
{
delete[] _str;
_str = nullptr;
_capacity =_size= 0;
}
private:
char* _str;
size_t _size;
size_t _capacity;
static const size_t npos;
};
const size_t string::npos = -1;
ostream& operator<<(ostream& out, const string& s)
{
for (auto ch : s)
{
out << ch;
}
return out;
}
istream& operator>>(istream& in, string& s)
{
s.clear();
char ch = in.get();
char buff[128];
size_t i = 0;
while (ch != ' ' && ch != '\n')
{
buff[i++] = ch;
if (i == 127)
{
buff[127] = '\0';
s += buff;
i = 0;
}
ch = in.get();
}
if (i != 0)
{
buff[i] = '\0';
s += buff;
}
return in;
}
void test_string1()
{
string s1;
string s2("hello world");
cout << s1.c_str() << endl;
cout << s2.c_str() << endl;
}
void test_string2()
{
string s("hello world");
//下标遍历
for (size_t i = 0; i < s.size(); i++)
{
cout<<s[i];
}
cout << endl;
//iterator遍历
string::iterator it = s.begin();
while (it < s.end())
{
cout << *it;
it++;
}
cout << endl;
//范围for
for (auto ch : s)
{
cout << ch;
}
}
}