面试题:简易版string(深拷贝与浅拷贝的问题)
如果要实现简易版的string 无需涉及增容问题,成员变量可以不用存储容量和元素个数
构造函数
错误示范
class string
{
string()
: _str(nullptr)
{}
string(const char* str)
: _str(str)
{}
char& operator[](size_t i)
{
return _str[i];
}
size_t size()
{
return strlen(_str);
}
private:
char* _str;
}
void test
{
string s1;
string s2("world");
for(size_t i = 0; i < s2.size();++i)
{
s2[i]+=1;
cout << s2[i] << endl;
//这个循环中会报内存错误,为什么呢?
}
}
以上的代码会报错,我们具体来分析一下
首先在构造s2的时候我们传过去了一个常量字符串,而常量位于操作系统的代码段中,无法被修改,当传过去以后指针str接收,于是str就指向了代码段中的’w‘这个字符,但无法修改,以至于造成内存错误
图1
以上还带来的其他问题:假如待会要插入字符串,空间不够无法实现怎么办?(如果不是简易版的话怎么办?)
正确示范
思路:通过图1我们可知常量字符串是在代码段的,所以才无法修改,那我们把它放在其他可以修改的地方不就可以了吗?那具体放在哪呢?既然要支持动态增容,那么放在堆上(既可以扩容,又可以修改)是最好的!而s1的构造函数也不能直接把成员变量置为空,因为如果置为空了,那么就无法进行扩容及遍历:string对象创建出来即使没有有效字符也要有一个空间来存放'\0'
class string//正确示范
{
string(const char* str = '')
: _str(new char[strlen(str)+1])//多出来一个空间是为了存储'\0的'
{
strcpy(_str,str);
}
char& operator[](size_t i)
{
return _str[i];
}
size_t size()
{
return strlen(_str);
}
private:
char* _str;
}
void test
{
string s1;
string s2("world");
for(size_t i = 0; i < s2.size();++i)
{
s2[i]+=1;
cout << s2[i] << endl;
}
}
图2
析构函数
class string
{
//....
~string()//这里是析构函数
{
delete [] _str;
_str = nullptr;
}
//....
private:
char* _str;
}
拷贝构造
如果我们不写拷贝构造,那么编译器会自动运行默认的拷贝构造,那么这个拷贝构造有什么问题吗?
class string
{
//...省略这个string类,假如这个类里没有拷贝构造
}
void test
{
string s1("world");
string s2(s1);
}
假如是以上代码,编译器会怎么执行呢?
编译器会把s1中的成员指针变量指向的地址给s2,并让他们两个指向同一块地址。这也就是所谓的浅拷贝/值拷贝。在执行前期不会出现什么内存问题,但是当执行到s1的析构函数时会造成同一块空间被释放了两次。
图3
解决办法就是:在构造s2时,重新在堆上开一块空间,再把s1的内容拷贝至s2即可
图4
class string
{
//....
string(const string& s
: _str(new char[strlen(s._str)+1])
{
strcpy(_str,s._str);
}
//....
private:
char* _str;
}
第二种写法:深拷贝
这种写法就是通过swap函数把要拷贝的string对象的值和当前string对象的值进行交换
string(const string& s)
:_str(nullptr)//如果不置为空tmp交换完以后就是随机值,析构会报错
{
string tmp(s._str);
swap(_str,tmp._str);
}
赋值函数(operator=)
思路:这里的思路是先创建一个空间存放右操作数并拷贝,再把成员变量指向那个空间所指向的地方,并记得释放原来的空间
class string
{
public:
//...
string& operator=(const string& s)
{
char* tmp = new char[strlen(s._str)+1];
strcpy(tmp,s._str)
delete [] _str;
_str = tmp;
}
//这里的返回值是为了支持连等,例如s1 = s2 = s3,就是s3先赋给s2,s2再赋给s1
private:
char* _str;
}
到这里,这个简易版的string就已经实现了,下面让我们看看支持增删查改的string是如何实现的吧
代码区
class string
{
public:
string(const char* str ="")//构造函数
:_str(new char[strlen(str)+1])
{
strcpy(_str, str);
}
string(const string& s)//拷贝构造
: _str(new char[strlen(s._str)+1])
{
strcpy(_str, s._str);
}
~string()//析构函数
{
delete [] _str;
_str = nullptr;
}
string& operator=(const string& s)
{
char* tmp = new char[strlen(s._str) + 1];
strcpy(tmp, _str);
delete[]_str;
_str = tmp;
return *this;
}
size_t size()
{
return strlen(_str);
}
char& operator[](size_t i)
{
return _str[i];
}
private:
char* _str;
};
完整版string实现
成员变量的变化以及原因
当涉及到增的问题时,就需要有两个变量,一个控制能存多少有效字符,一个控制当前有效字符个数。以及对简易版进行优化
class string
{
public:
private:
char* _str;
size_t _capacity;
size_t _size;
}
string的构造函数、析构函数、拷贝构造、赋值
这里直接放代码了,不懂看前面
class string
{
public:
string(const char* str = "")//构造函数
{
_size = strlen(str);
_capacity = _size;
_str = new char[_capacity+1];
strcpy(_str, str);
}
~string()//析构函数
{
delete [] _str;
_str = nullptr;
_size = _capacity = 0;
}
string(const string& s)//拷贝构造
:_str(new char[s._capacity+1])
{
strcpy(_str, s._str);
}
string& operator=(const string& s)//赋值
{
char* tmp = new char[s._capacity + 1];
strcpy(tmp, s._str);
delete[]_str;
_str = tmp;
return *this;
}
size_t size()
{
return _size;
}
size_t capacity()
{
return _capacity;
}
char& operator[](size_t i)
{
assert (i >= 0);
return _str[i];
}
const char* c_str()
{
return _str;
}
private:
char* _str;
size_t _capacity;
size_t _size;
};
operator<<
ostream& operator<<(ostream& out, const string& s)//opeartor<<
{
for (size_t i = 0; i < s.size(); ++i)
{
cout << s[i];
}
return out;
}
operator+=
这里分为三种:①+=常量字符
②+=常量字符串
③+=对象
思想就是:在_size位置直接插入字符,因为把原来的'\0'覆盖了,而c++中字符串的结束标准就是'\0'所以最后在尾上补上'\0'即可,插入字符都要考虑空间,于是封装一个increase用来扩容
class string
{
public:
//....
char*& increase(size_t n)//传参数时直接传插入后有效字符的个数
{
//扩容
size_t newcapacity = n;
char* tmp = new char[n + 1];
_capacity = newcapacity;
//拷贝原数组
strcpy(tmp, _str);
return tmp;
}
string& operator+=(const char* str)//+=字符串
{
size_t len = strlen(str);
//扩容及直接插入
while (*str != '\0')
{
//判断是否扩容
if (_capacity == _size)
{
char* tmp = increase(_capacity+len);
delete[] _str;
_str = tmp;
}
//插入
_str[_size] = *str;
++_size;
++str;
}
//补上'\0';
_str[_size] = '\0';
return *this;
}
string& operator+=(const char ch)//+=字符
{
//判断是否扩容
if (_size == _capacity)
{
char* tmp = increase();
delete[] _str;
_str = tmp
}
//插入字符
_str[_size] = ch;
_size++;
//补上'\0'
_str[_size] = '\0';
return *this;
}
string& operator+=(const string& s)//+=对象
{
size_t len = s._size;
//扩容
if (_size + len > _capacity)
{
char* tmp = increase(_capacity+len);
delete[] _str;
_str = tmp;
}
//赋值,转化为operator(const char* ch)
*this += (s._str);
return *this;
}
//....
}
private:
char* _str;
size_t _capacity;
size_t _size;
}
operator>>
istream& operator>>(istream& in, string& s)
{
char ch = in.get();//先获取一个字符
while (ch == '\n'|| ch ==' ')//如果获取的字符是空格或换行则跳出循环
{
s += ch;
ch = in.get();//这里继续获取,反复进入while循环的判断
}
return in;
}
任意位置的插入与删除(insert)
这里实现两个:
①字符串在pos位置的插入
②字符在pos位置的插入
这里用两种思想,一种是先插入后挪动(字符常量用的是这种),一种是先挪动再插入(字符串用的是这种)
string& insert(size_t pos, char ch)
{
assert(pos<size)
//插入
*this += ch;
int end = _size - 1;
//挪动数据
while (end >= pos)
{
_str[end + 1] = _str[end];
--end;
}
//插入及补上'\0'
_str[end+1] = _str[_size];
_str[_size] = '\0';
return *this;
}
string& insert(size_t pos, const char* str)
{
assert(pos <= _size);
//判断扩容
size_t len = strlen(str);
if (_size + pos > _capacity)
{
_str = increase(_size + pos);
}
//挪动数据
int end = _size;
while (end >= (int)pos)
{
_str[end + len] = _str[end];
--end;
}
//插入数据
for (size_t i = 0; i < len; ++i)
{
_str[pos++] = str[i];
}
_size += len;
return *this;
}
迭代器(iterator)
string的迭代器比较简单,本质就是一个指针
class string
{
public:
typedef char* iterator//定义迭代器
iterator begin()
{
return _str;
}
iterator end()
{
return _str + _size;
}
//....
private:
char* _str;
}
//测试迭代器
void test()
{
string s1("hello");
string::iterator it = s1.begin();
while (it != s1.end())
{
cout << *it << ' ';
++it;
}
}
查找(find)
查找字符
size_t find(char ch, size_t pos = 0)//从pos位置开始往后找,找到返回下标
{
assert(pos >= 0);
size_t i = pos;
//找到返回下标
while (i < _size)
{
if (_str[i] == ch)
{
return i;
}
++i;
}
//没找到返回npos,npos是静态成员变量默认值为-1
return npos;
}
return npos;
}
size_t find(const char* str, size_t pos = 0)
{
assert (pos >= 0);
char* tmp = strstr(_str + pos, str);
if (tmp == NULL)
return npos;
else
return tmp - _str;
}
operator<,==,<=,>,>=,!=
bool operator<(const string& s)
{
int i = strcmp(_str, s._str);
if (i >= 0)
return false;
else
return true;
}
bool operator==(const string& s)
{
int i = strcmp(_str, s._str);
if (i == 0)
return true;
else
return false;
}
bool operator<=(const string& s)
{
return *this < s || *this == s;
}
bool operator>(const string& s)
{
return !(* this <= s);
}
bool operator>=(const string& s)
{
return !(* this < s);
}
bool operator!=(const string& s)
{
return !(*this == s);
}
删除(erase)
void erase(size_t pos, size_t len = npos)//从pos位置开始删,删除len个字符
{
//第二种情况
if (len >= _size - pos)//如果
{
_str[pos] = '\0';
_size = pos;
}
//第一种情况
else
{
for (size_t i = pos + len; i <= _size; ++i)
{
_str[i - len] = _str[i];
}
_size -= len;
}
}