《操作系统导论》第14章读书笔记:插叙:内存操作API
—— 杭州 2024-03-30 夜
文章目录
- 《操作系统导论》第14章读书笔记:插叙:内存操作API
- 1.内存类型
- 1.1.栈内存:它的申请和释放操作是编译器来隐式管理的,所以有时也称为自动(automatic)内存。
- 1.2.堆(heap)内存:其中所有的申请和释放操作都由程序员显式地完成。
- 2.malloc()调用
- 3.free()调用
- 4.常见错误
- 4.1.忘记分配内存
- 4.2.没有分配足够的内存:缓冲区溢出(buffer overflow)
- 4.3.忘记初始化分配的内存
- 4.4.忘记释放内存:内存泄露(memory leak)
- 4.5.在用完之前释放内存:悬挂指针(dangling pointer)
- 4.6.反复释放内存
- 4.7.错误地调用free()
- 4.8.补充:为什么在你的进程退出时没有内存泄露
- 5.底层操作系统支持
- 6.其他调用和小结
- 7.补充笔记:malloc()、calloc()、realloc()比较
1.内存类型
1.1.栈内存:它的申请和释放操作是编译器来隐式管理的,所以有时也称为自动(automatic)内存。
void func() {
int x; // declares an integer on the stack
...
}
1.2.堆(heap)内存:其中所有的申请和释放操作都由程序员显式地完成。
void func() {
int *x = (int *) malloc(sizeof(int));
...
}
- 关于这一小段代码有两点说明。首先,你可能会注意到栈和堆的分配都发生在这一行:首先编译器看到指针的声明(int * x)时,知道为一个整型指针分配空间,随后,当程序调用malloc()时,它会在堆上请求整数的空间,函数返回这样一个整数的地址(成功时,失败时则返回NULL),然后将其存储在栈中以供程序使用。
2.malloc()调用
- malloc 函数非常简单:传入要申请的堆空间的大小,它成功就返回一个指向新申请空间的指针,失败就返回NULL。man 手册展示了使用malloc 需要怎么做,在命令行输入man malloc,你会看到:
#include <stdlib.h>
...
void *malloc(size_t size);
- 你也可以传入一个变量的名字(而不只是类型)给sizeof(),但在一些情况下,可能得不到你要的结果,所以要小心使用。例如,看看下面的代码片段:
int *x = malloc(10 * sizeof(int));
printf("%d\n", sizeof(x));
- 在第一行,我们为10个整数的数组声明了空间,这很好,很漂亮。但是,当我们在下一行使用sizeof()时,它将返回一个较小的值,例如4(在32位计算机上)或8(在64 位计算机上)。原因是在这种情况下,sizeof()但为我们只是问一个整数的指针有多大,而不是我们动态分配了多少内存。
但是,有时sizeof()的确如你所期望的那样工作:
int x[10];
printf("%d\n", sizeof(x));
- 在这种情况下,编译器有足够的静态信息,知道已经分配了40个字我。另一个需要注意的地方是使用字符串。如果为一个字符串声明空间,请使用以下习惯用法:malloc(strlen(s) + 1),它使用函数strlen()获取字符串的长度,并加上1,以便为字符串结束符留出空间。这里使用sizeof()可能会导致麻烦。
- 你也许还注意到malloc()返回一个指向void类型的指针。这样做只是C中传回地址的方式,让程序员决定如何处理它。程序员将进一步使用所谓的强制类型转换(cast),在我们上面的示例中,程序员将返回类型的malloc()强制转换为指向double的指针。强制类型转换实实上没干什么事,只是告诉编译器和其他可能正在读你的代码的程序员:“是的,我知道我在做什么。”通过强制转换malloc()的结果,程序员只是在给人一些信心,强制转换不是程序正确所必须的。
3.free()调用
- 事实证明,分配内存是等式的简单部分。知道何时、如何以及是否释放内存是困难的部分。要释放不再使用的堆内存,程序员只需调用free():
int *x = malloc(10 * sizeof(int));
...
free(x);
- 该函数接受一个参数,即一个由malloc()返回的指针。因此,你可能会注意到,分配区域的大小不会被用户传入,必须由内存分配库本身记录追踪。
4.常见错误
4.1.忘记分配内存
许多例程在调用之前,都希望你为它们分配内存。例如,例程strcpy(dst, src)将源字符串中的字符串复制到目标指针。但是,如果不小心,你可能会这样做:
char *src = "hello";
char *dst; // oops! unallocated
strcpy(dst, src); // segfault and die
运行这段代码时,可能会导致段错误(segmentation fault)。
- 仅仅因为程序编译过了甚至正确运行了一次或多次,并不意味着程序是正确的。
在这个例子中,正确的代码可能像这样:
char *src = "hello";
char *dst = (char *) malloc(strlen(src) + 1);
strcpy(dst, src); // work properly
或者你可以用strdup(),让生活本加轻松。
4.2.没有分配足够的内存:缓冲区溢出(buffer overflow)
char *src = "hello";
char *dst = (char *) malloc(strlen(src)); // too small!
strcpy(dst, src); // work properly
奇怪的是,这个程序通常看起来会正确运行,这取决于如何实现malloc 和许多其他细节。在某些情况下,当字符串拷贝执行时,它会在超过分配空间的末尾处写入一个字节,但在某些情况下,这是无害的,可能会覆盖不再使用的变量。在某些情况下,这些溢出可能具有令人难以置信的危害,实实上是系统中许多安全漏洞的来源。在其他情况下,malloc库总是分配一些额外的空间,因此你的程序实际上不会在其他某个变量的值上涂写,并且工作得很好。还有一些情况下,该程序确实会发生故障和崩溃。
- 一个宝贵的教训:即使它正确运行过一次,也不意味着它是正确的。
4.3.忘记初始化分配的内存
4.4.忘记释放内存:内存泄露(memory leak)
另一个常见错误称为内存泄露(memory leak),如果忘记释放内存,就会发生。
- 在长时间运行的应用程序或系统(如操作系统本身)中,这是一个巨大的问题,因为缓慢泄露的内存会导致内存不足,此时需要重新启动。因此,一般来说,当你用完一段内存时,应该确保释放它。请注意,使用垃圾收集语言在这里没有什么帮助:如果你仍然拥有对某块内存的引用,那么垃圾收集器就不会释放它,因此即使在较现代的语言中,内存泄露仍然是一个问题。
- 在某些情况下,不调用free()似乎是合理的。例如,你的程序运行时间很短,很块就会退出。在这种情况下,当进程死亡时,操作系统将清理其分配的所有页面,因此不会发生内存泄露。虽然这肯定“有效”(请参阅后面的补充),但这可能是一个坏习惯,所以请谨慎选择这样的策略。长远来看,作为程序员的目标之一是养成良好的习惯。其中一个习惯是理解如何管理内存,并在C这样的语言中,释放分配的内存块。即使你不这样做也可以逃脱惩罚,建议还是养成习惯,释放显式分配的每个字节。
4.5.在用完之前释放内存:悬挂指针(dangling pointer)
有时候程序会在用完之前释放内存,这种错误称为悬挂指针(dangling pointer),正如你猜测的那样,这也是一件坏事。随后的使用可能会导致程序崩溃或覆盖有效的内存(例如,你调用了free(),但随后再次调用malloc()来分配其他内容,这重新利用了错误释放的内存)。
4.6.反复释放内存
4.7.错误地调用free()
4.8.补充:为什么在你的进程退出时没有内存泄露
-
当你编写一个短时间运行的程序时,可能会使用malloc()分配一些空间。程序运行并即将完成:是否需要在退出前调用几次free()?虽然不释放似乎不对,但在真正的意义上,没有任何内存会“丢失”。原因很简单:系统中实际存在两级内存管理。
-
第一级是由操作系统执行的内存管理,操作系统在进程运行时将内存交给进程,并在进程退出(或以其他方式结束)时将其回收。第二级管理在每个进程中,例如在调用malloc()和free()时,在堆内管理。即使你没有调用free()(并因此泄露了堆中的内存),操作系统也会在程序结束运行时,收回进程的所有内存(包括用于代码、栈,以及相关堆的内存页)。无论地址空间中堆的状态如何,操作系统都会在进程终止时收回所有这些页面,从而确保即使没有释放内存,也不会丢失内存。
-
因此,对于短时间运行的程序,泄露内存通常不会导致任何操作问题(尽管它可能被认为是不好的形式)。如果你编写一个长期运行的服务器(例如Web 服务器或数据库管理系统,它永远不会退出),泄露内存就是很大的问题,最终会导致应用程序在内存不足时崩溃。当然,在某个程序内部泄露内存是一个更大的问题:操作系统本身。这再次向我们展示:编写内核代码的人,工作是辛苦的……
5.底层操作系统支持
-
你可能已经注意到,在讨论malloc()和free()时,我们没有讨论系统调用。原因很简单:它们不是系统调用,而是库调用。因此,malloc库管理虚拟地址空间内的空间,但是它本身是建立在一些系统调用之上的,这些系统调用会进入操作系统,来请求本多内存或者将一些内容释放回系统。
-
最后,你还可以通过mmap()调用从操作系统获取内存。通过传入正确的参数,mmap()可以在程序中创建一个匿名(anonymous)内存区域——这个区域不与任何特定文件相关联,而是与交换空间(swapspace)相关联,稍后我们将在虚拟内存中详细讨论。这种内存也可以像堆一样对待并管理。阅读mmap()的手册页以获取本多详细信息。
6.其他调用和小结
7.补充笔记:malloc()、calloc()、realloc()比较
当涉及到动态内存分配时,malloc()
, calloc()
, 和 realloc()
是 C 语言标准库中的三个重要函数。以下是这三个函数的比较表格:
特征/函数 | malloc() | calloc() | realloc() |
---|---|---|---|
功能 | 分配指定大小的内存块 | 分配指定数量的连续内存块,并将每一块初始化为 0 | 改变先前分配的内存块的大小 |
参数 | 需要分配的内存块大小(以字节为单位) | 内存块的数量和每个块的大小(以字节为单位) | 指向先前分配的内存块的指针以及新的内存大小 |
返回值 | 指向分配的内存块的指针,如果分配失败则返回 NULL | 指向分配且初始化的内存块的指针,如果分配失败则返回 NULL | 指向重新分配的内存块的指针,如果分配失败则返回 NULL |
初始化 | 不初始化内存块,内存块的内容不确定 | 将内存块的每个字节都初始化为 0 | 不初始化新分配的内存部分,旧内存内容保持不变至新大小 |
性能 | 通常比 calloc() 快,因为不初始化内存 | 可能比 malloc() 慢,因为初始化内存 | 性能依赖于给定的内存块和分配大小 |
适用性 | 当不需要初始化内存时使用 | 当需要初始化数组或多个相同类型的对象时使用 | 当需要调整先前分配的内存大小时使用 |
示例代码 | int *ptr = (int*)malloc(sizeof(int) * n); | int *ptr = (int*)calloc(n, sizeof(int)); | ptr = (int*)realloc(ptr, sizeof(int) * n); |
注意:
malloc()
和calloc()
在失败时都会返回NULL
,因此在使用这些函数后应该检查返回值以确认内存分配是否成功。realloc()
在扩大内存块时,可能会移动内存块到新的位置,如果是这样,它会复制旧内存内容到新位置并释放旧内存。- 如果
realloc()
的第一个参数是NULL
,它等价于malloc()
。 - 在使用完分配的内存后,你应该使用
free()
函数释放它,以避免内存泄漏。