字符串和内存函数
- 1. 前言
- 2. 求字符串长度
- 2.1 strlen
- 3. 长度不受限制的字符串函数
- 3.1 strcpy
- 3.2 strcat
- 3.3 strcmp
- 4. 长度受限制的字符串函数
- 4.1 strncpy
- 4.2 strncat
- 4.3 strncmp
- 5. 字符串查找
- 5.1 strstr
- 5.2 strtok
- 6. 错误信息报告
- 6.1 strerror
- 7. 字符操作函数
- 7.1 字符分类函数
- 7.2 字符转换函数
- 8. 内存操作函数
- 8.1 memcpy
- 8.2 memmove
- 8.3 memcmp
1. 前言
大家好,我是努力学习游泳的鱼。今天我们来学习一些常用的库函数。有了这些库函数,我们可以更加方便地操作字符串和内存,从而提升我们的编码效率。话不多说,我们开始吧!
注:以下大部分函数对应的头文件都是string.h
。
2. 求字符串长度
2.1 strlen
size_t strlen ( const char * str );
strlen
函数可以求字符串的长度。使用时只需把字符串的起始位置的地址作为参数传递给strlen
。该函数会从起始位置一直往后数字符,直到遇到\0
。最终返回的是\0
之前字符的个数。- 参数指向的字符串必须以
\0
结束。否则求出来的是随机值。 - 返回类型是
size_t
,是无符号类型。
接下来使用三种方式来模拟实现strlen
。
// 1. 使用计数器
size_t my_strlen(const char* str)
{
int count = 0;
assert(str != NULL);
while (*str != '\0')
{
count++;
str++;
}
return count;
}
// 2. 递归
size_t my_strlen(const char* str)
{
assert(str != NULL);
if (*str == '\0')
return 0;
else
return 1 + my_strlen(str + 1);
}
// 3. 指针-指针
size_t my_strlen(const char* str)
{
assert(str != NULL);
char* begin = str;
// 找\0
while (*str != '\0')
{
str++;
}
return str - begin;
}
3. 长度不受限制的字符串函数
3.1 strcpy
char* strcpy(char * destination, const char * source );
strcpy
函数会把源字符串拷贝到目标空间中去。- 源字符串必须以
\0
结束。 - 会将源字符串中的
\0
拷贝到目标空间。 - 目标空间必须足够大,以确保可以存放源字符串。
- 目标空间必须可变。
strcpy
返回的是目标空间的起始地址。
接下来我们来模拟实现strcpy
函数。
char* my_strcpy(char* dest, const char* src)
{
char* ret = dest;
assert(dest && src);
while (*dest++ = *src++)
{
;
}
return ret;
}
3.2 strcat
char * strcat ( char * destination, const char * source );
strcat
会把源字符串追加到目标字符串后面。- 源字符串必须以
\0
结束。 - 会把源字符串的
\0
拷贝到目标空间中去。 - 目标空间必须足够大,以确保可以存放源字符串。
- 目标空间必须可变。
strcat
返回的是目标空间的起始地址。- 不能自己给自己追加,因为当源字符串和目标空间重合时,会覆盖掉源字符串后面的
\0
。
有没有发现,其中很多点和strcpy
很像?
接下来我们来模拟实现strcat
。只需要两步:
- 找到目标空间的
\0
。 - 从目标空间的
\0
开始,把源字符串拷贝到目标空间中去。
char* my_strcat(char* dest, const char* src)
{
assert(dest && src);
char* ret = dest;
// 找目标空间的\0
while (*dest)
{
dest++;
}
// 从目标空间的\0开始,向后拷贝
while (*dest++ = *src++)
{
;
}
return ret;
}
3.3 strcmp
int strcmp ( const char * str1, const char * str2 );
strcmp
函数比较的不是字符串的长度,而是比较字符串中对应位置上的字符的大小,如果相同,就比较下一对儿,直到不同或者都遇到\0
。- 若
str1<str2
,则返回值为负数;若str1>str2
,则返回值为正数;若str1=str2
,则返回值为0
。
接下来我们来模拟实现strcmp
。
int my_strcmp(const char* str1, const char* str2)
{
assert(str1 && str2);
while (*str1 == *str2)
{
if (*str1 == '\0')
{
return 0; // 相等
}
str1++;
str2++;
}
// 不相等
if (*str1 > *str2)
{
return 1;
}
else
{
return -1;
}
}
4. 长度受限制的字符串函数
4.1 strncpy
char * strncpy ( char * destination, const char * source, size_t num );
- 拷贝
num
个字符从源字符串到目标空间。 - 如果源字符串的长度小于
num
,则拷贝完源字符串后,在目标的后面追加0
,直到num
个。
下面是strncpy
的模拟实现。
char* my_strncpy(char* dest, const char* src, size_t count)
{
assert(dest && src);
char* start = dest;
while (count && (*dest++ = *src++) != '\0')
{
count--;
}
if (count)
{
while (--count)
{
*dest++ = '\0';
}
}
return start;
}
4.2 strncat
char * strncat ( char * destination, const char * source, size_t num );
- 在目标空间后最多追加
num
个字符。 - 如果
num
大于源字符串的长度,则num
直接看作源字符串的长度。 - 一定会在最后追加
\0
。
模拟实现如下:
char* my_strncat(char* front, const char* back, size_t count)
{
assert(front && back);
char* start = front;
// 找front中的\0
while (*front)
{
front++;
}
// 拷贝
while (count--)
{
if ((*front++ = *back++) == '\0')
{
return start;
}
}
*front = '\0';
return start;
}
4.3 strncmp
int strncmp ( const char * str1, const char * str2, size_t num );
- 只比较前
num
个字符。
以下是模拟实现:
int my_strncpy(const char* s1, const char* s2, size_t count)
{
assert(s1 && s2);
while (1)
{
if (count == 0)
{
return 0;
}
else if (*s1 > *s2)
{
return 1;
}
else if (*s1 < *s2)
{
return -1;
}
else
{
if (*s1 == '\0')
{
return 0;
}
s1++;
s2++;
count--;
}
}
}
5. 字符串查找
5.1 strstr
char * strstr ( const char *str1, const char * str2);
- 在
str1
中查找str2
,如果找到了,就返回第一次出现的起始位置;如果找不到,就返回空指针NULL
。
最简单的实现方式是直接暴力查找。
char* my_strstr(const char* str1, const char* str2)
{
assert(str1 && str2);
const char* s1 = str1;
const char* s2 = str2;
const char* cur = str1;
while (*cur)
{
s1 = cur;
s2 = str2;
while (*s1 && *s2 && *s1 == *s2)
{
s1++;
s2++;
}
if (*s2 == '\0')
{
// 找到了
return (char*)cur;
}
cur++;
}
// 找不到
return NULL;
}
5.2 strtok
char * strtok ( char * str, const char * sep );
strtok
用于分割字符串。sep
是一个字符串,定义了用作分隔符的字符集合。- 第一个参数指定一个字符串,它包含了
0
个或者多个由sep
字符串中一个或者多个分隔符分割的标记。 strtok
函数找到str
中的下一个标记,并将其用\0
结尾,返回一个指向这个标记的指针。(注:strtok
函数会改变被操作的字符串,所以在使用strtok
函数切分的字符串一般都是临时拷贝的内容并且可修改。)strtok
函数的第一个参数不为NULL
,函数将找到str
中第一个标记,strtok
函数将保存它在字符串中的位置。strtok
函数的第一个参数为NULL
,函数将在同一个字符串中被保存的位置开始,查找下一个标记。- 如果字符串中不存在更多的标记,则返回
NULL
指针。
使用举例:
#include <stdio.h>
#include <string.h>
int main()
{
char arr[] = "abc@def.123@456";
char buf[30] = { 0 }; // 使用strtok,一般要做备份
strcpy(buf, arr);
const char* sep = "@."; // 分隔符的集合
char* str = NULL;
for (str = strtok(buf, sep); str != NULL; str = strtok(NULL, sep))
{
printf("%s\n", str);
}
return 0;
}
6. 错误信息报告
6.1 strerror
char * strerror ( int errnum );
- 会返回错误码对应的错误信息。
- 有一个全局变量
errno
,会记录库函数在调用失败后的错误码。使用时需要引用头文件errno.h
。
使用举例:
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <limits.h>
#include <errno.h>
int main()
{
int* p = (int*)malloc(INT_MAX);
if (p == NULL)
{
printf("%s\n", strerror(errno));
}
return 0;
}
7. 字符操作函数
以下函数对应的头文件是ctype.h
。
7.1 字符分类函数
函数 | 如果它的参数复合下列条件就返回真 |
---|---|
iscntrl | 任何控制字符 |
isspace | 任何空白字符 |
isdigit | 十进制数字 |
isxdigit | 十六进制数字 |
islower | 小写字母 |
isupper | 大写字母 |
isalpha | 大小写字母 |
isalnum | 大小写字母或数字 |
ispunct | 标点符号 |
isgraph | 图形字符 |
isprint | 可打印字符 |
7.2 字符转换函数
转小写:
int tolower( int c );
转大写
int toupper( int c );
8. 内存操作函数
8.1 memcpy
void * memcpy ( void * destination, const void * source, size_t num );
- 函数
memcpy
从source
的位置开始向后复制num
个字节的数据到destination
的内存位置。 - 这个函数在遇到
'\0'
的时候并不会停下来。 - 如果
source
和destination
有任何的重叠,复制的结果都是未定义的。
模拟实现如下:
void* my_memcpy(void* dest, const void* src, size_t count)
{
assert(dest && src);
void* ret = dest;
while (count--)
{
*(char*)dest = *(char*)src;
dest = (char*)dest + 1;
src = (char*)src + 1;
}
return ret;
}
8.2 memmove
void * memmove ( void * destination, const void * source, size_t num );
- 和
memcpy
的差别就是memmove
函数处理的源内存块和目标内存块是可以重叠的。 - 如果源空间和目标空间出现重叠,就得使用
memmove
函数处理。
模拟实现如下:
void* my_memmove(void* dest, const void* src, size_t count)
{
assert(dest && src);
void* ret = dest;
if (dest < src)
{
// 前->后
while (count--)
{
*(char*)dest = *(char*)src;
dest = (char*)dest + 1;
src = (char*)src + 1;
}
}
else
{
// 后->前
while (count--)
{
*((char*)dest + count) = *((char*)src + count);
}
}
return ret;
}
8.3 memcmp
int memcmp ( const void * ptr1,
const void * ptr2,
size_t num );
- 比较从
ptr1
和ptr2
指针开始的num
个字节。 - 返回值和
strcmp
类似,根据大小关系返回正数、负数或者0
。
模拟实现如下:
int my_memcmp(const void* ptr1, const void* ptr2, size_t num)
{
assert(ptr1 && ptr2);
while (num--)
{
if (*(char*)ptr1 > *(char*)ptr2)
{
return 1;
}
else if (*(char*)ptr1 < *(char*)ptr2)
{
return -1;
}
ptr1 = (char*)ptr1 + 1;
ptr2 = (char*)ptr2 + 1;
}
return 0;
}