目录
1. 为什么学习string类?
1.1 C语言中的字符串
2. 标准库中的string类
2.1 string类(了解)
2.2 string类的常用接口说明
1. string类对象的常见构造
2. string类对象的
3. string类对象的访问及遍历操作
4. string类对象的修改操作
5. string类非成员函数
6. vs和g++下string结构的说明
1. 为什么学习string类?
1.1 C语言中的字符串
C
语言中,字符串是以
'\0'
结尾的一些字符的集合,为了操作方便,
C
标准库中提供了一些
str
系列的库函数,
但是这些库函数与字符串是分离开的,不太符合
OOP
的思想,而且底层空间需要用户自己管理,稍不留神可
能还会越界访问。
2. 标准库中的string类
2.1 string类(了解)
1.
字符串是表示字符序列的类
2.
标准的字符串类提供了对此类对象的支持,其接口类似于标准字符容器的接口,但添加了专门用于操作
单字节字符字符串的设计特性。
3. string
类是使用
char(
即作为它的字符类型,使用它的默认
char_traits
和分配器类型
(
关于模板的更多信
息,请参阅
basic_string)
。
4. string
类是
basic_string
模板类的一个实例,它使用
char
来实例化
basic_string
模板类,并用
char_traits
和
allocator
作为
basic_string
的默认参数
(
根于更多的模板信息请参考
basic_string)
。
5.
注意,这个类独立于所使用的编码来处理字节
:
如果用来处理多字节或变长字符
(
如
UTF-8)
的序列,这个
类的所有成员
(
如长度或大小
)
以及它的迭代器,将仍然按照字节
(
而不是实际编码的字符
)
来操作。
总结:
1. string
是表示字符串的字符串类
2.
该类的接口与常规容器的接口基本相同,再添加了一些专门用来操作
string
的常规操作。
3. string
在底层实际是:
basic_string
模板类的别名,
typedef basic_string<char, char_traits, allocator>
string;
4.
不能操作多字节或者变长字符的序列。
在
使用
string
类时,必须包含
#include
头文件以及
using namespace std
;
2.2 string类的常用接口说明
1. string类对象的常见构造
(图片来源于网图)
2. string类对象的
(图片来源于网图)
注意:
1. size()
与
length()
方法底层实现原理完全相同,引入
size()
的原因是为了与其他容器的接口保持一
致,一般情况下基本都是用
size()
。
2. clear()
只是将
string
中有效字符清空,不改变底层空间大小。
3. resize(size_t n)
与
resize(size_t n, char c)
都是将字符串中有效字符个数改变到
n
个,不同的是当字
符个数增多时:
resize(n)
用
0
来填充多出的元素空间,
resize(size_t n, char c)
用字符
c
来填充多出的
元素空间。注意:
resize
在改变元素个数时,如果是将元素个数增多,可能会改变底层容量的大
小,如果是将元素个数减少,底层空间总大小不变。
4. reserve(size_t res_arg=0)
:为
string
预留空间,不改变有效元素个数,当
reserve
的参数小于
string
的底层空间总大小时,
reserver
不会改变容量大小。
3. string类对象的访问及遍历操作
函数名称功能说明operator[] (重点)返回 pos 位置的字符, const string 类对象调用begin + endbegin 获取一个字符的迭代器 + end 获取最后一个字符下一个位置的迭 代器rbegin + rendbegin 获取一个字符的迭代器 + end 获取最后一个字符下一个位置的迭 代器 范围 forC++11 支持更简洁的范围 for 的新遍历方式
4. string类对象的修改操作
函数名称功能说明push_back在字符串后尾插字符 cappend在字符串后追加一个字符串operator+= ( 重点 )在字符串后追加字符串 strc_str ( 重点 )返回 C 格式字符串fifind + npos ( 重点 )从字符串 pos 位置开始往后找字符 c ,返回该字符在字符串中的位置rfifind从字符串 pos 位置开始往前找字符 c ,返回该字符在字符串中的位置substr在 str 中从 pos 位置开始,截取 n 个字符,然后将其返回
注意:
1.
在
string
尾部追加字符时,
s.push_back(c) / s.append(1, c) / s += 'c'
三种的实现方式差不多,一般
情况下
string
类的
+=
操作用的比较多,
+=
操作不仅可以连接单个字符,还可以连接字符串。
2.
对
string
操作时,如果能够大概预估到放多少字符,可以先通过
reserve
把空间预留好。
5. string类非成员函数
(图片来源于网图)
6. vs和g++下string结构的说明
注意:下述结构是在
32
位平台下进行验证,
32
位平台下指针占
4
个字节。
vs
下
string
的结构
string
总共占
28
个字节
,内部结构稍微复杂一点,先是
有一个联合体,联合体用来定义
string
中字
符串的存储空间
:
当字符串长度小于
16
时,使用内部固定的字符数组来存放
当字符串长度大于等于
16
时,从堆上开辟空间
union _Bxty{ // storage for small buffer or pointer to larger onevalue_type _Buf [ _BUF_SIZE ];pointer _Ptr ;char _Alias [ _BUF_SIZE ]; // to permit aliasing} _Bx ;
这种设计也是有一定道理的,大多数情况下字符串的长度都小于
16
,那
string
对象创建好之后,内
部已经有了
16
个字符数组的固定空间,不需要通过堆创建,效率高。
其次:还有
一个
size_t
字段保存字符串长度,一个
size_t
字段保存从堆上开辟空间总的容量
最后:还
有一个指针
做一些其他事情。
故总共占
16+4+4+4=28
个字节。
g++
下
string
的结构
G++
下,
string
是通过写时拷贝实现的,
string
对象总共占
4
个字节,内部只包含了一个指针,该指
针将来指向一块堆空间,内部包含了如下字段:
空间总大小
字符串有效长度
引用计数
指向堆空间的指针,用来存储字符串
struct _Rep_base{size_type _M_length ;size_type _M_capacity ;_Atomic_word _M_refcount ;};