1. 为什么使用文件
如果没有文件,我们写的程序的数据是存储在电脑的内存中,如果程序退出,内存回收,数据就丢失了,等再次运行程序,是看不到上次程序的数据的,如果要将数据进行持久化的保存,我们可以使用文件。
C语言使用文件主要是为了实现数据的持久化存储和跨程序的数据交换。具体来说,以下是C语言使用文件的主要原因:
-
数据持久化:将数据保存在文件中,即使程序关闭或计算机重启,数据也不会丢失。这样,用户可以在需要时再次打开文件并读取或修改其中的数据。
-
跨程序数据交换:通过文件,不同的程序可以共享数据。例如,一个程序可以生成数据并将其保存到文件中,然后另一个程序可以读取这个文件并使用这些数据。
-
大量数据存储:当数据量很大时,使用文件存储比使用内存更合适。内存是易失的,且容量有限,而文件可以存储在硬盘等持久化存储设备上,容量更大且不易丢失。
-
程序与用户的交互:通过文件,程序可以读取用户提供的输入数据(如配置文件、文本文件等),也可以将结果输出到文件中供用户查看或使用。
在C语言中,你可以使用标准库中的文件操作函数来创建、打开、读取、写入和关闭文件。这些函数提供了灵活的文件访问方式,使程序员能够根据需要操作文件。
需要注意的是,虽然文件提供了很多便利,但在使用文件时也需要考虑一些问题,如文件路径的正确性、文件的打开模式、文件的读写权限、文件的错误处理等。
2. 什么是文件
文件是计算机中用于存储和记录数据的媒介。它可以是存储在硬盘、光盘、闪存或其他存储介质上的二进制或文本数据的集合。文件可以包含各种类型的信息,如文档、图片、音频、视频、程序代码等。
在计算机科学中,文件通常被组织成具有特定名称和格式的数据集合。每个文件都有一个唯一的标识符,称为文件名,用于在文件系统中识别它。文件名通常由字母、数字、特殊字符和文件扩展名组成,扩展名通常用于指示文件的类型或格式。
文件可以被操作系统或应用程序打开、读取、写入、修改和关闭。读取文件意味着从文件中获取数据并将其加载到内存中以供程序使用。写入文件则是将数据从内存保存到文件中。文件还可以被设置为只读、只写或读写模式,以控制对文件的访问权限。
文件的使用在计算机编程中非常普遍。程序可以使用文件来保存和加载用户数据、配置文件、日志文件等。通过使用文件,程序可以实现数据的持久化存储,使得数据在程序关闭或计算机重启后仍然可用。此外,文件也用于不同程序之间的数据交换和共享。
总的来说,文件是计算机中用于存储和记录数据的重要媒介,它使得数据的保存、读取和共享变得方便和灵活。
2.1 程序文件
程序文件包括源程序文件(后缀为.c),目标文件(windows环境后缀为.obj),可执行程序(windows环境后缀为.exe)。
2.2 数据文件
文件的内容不⼀定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,或者输出内容的文件。
本章讨论的是数据文件。
在以前各章所处理数据的输入输出都是以终端为对象的,即从终端的键盘输入数据,运行结果显示到显示器上。
其实有时候我们会把信息输出到磁盘上,当需要的时候再从磁盘上把数据读取到内存中使用,这里处理的就是磁盘上文件。
2.3 文件名
⼀个文件要有⼀个唯⼀的文件标识,以便用户识别和引用。
文件名包含3部分:文件路径+文件名主干+文件后缀
例如: c:\code\test.txt
为了方便起见,文件标识常被称为文件名。
3. 二进制文件和文本文件
根据数据的组织形式,数据文件被称为文本文件或者二进制文件。
数据在内存中以二进制的形式存储,如果不加转换的输出到外存的文件中,就是二进制文件。
如果要求在外存上以ASCII码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的文件就是文本文件。
⼀个数据在文件中是怎么存储的呢?
字符⼀律以ASCII形式存储,数值型数据既可以⽤ASCII形式存储,也可以使⽤⼆进制形式存储。
如有整数10000,如果以ASCII码的形式输出到磁盘,则磁盘中占用5个字节(每个字符⼀个字节),而二进制形式输出,则在磁盘上只占4个字节(VS测试)。
测试代码:
#include <stdio.h>
int main()
{
int a = 10000;
FILE* pf = fopen("test.txt", "wb");
fwrite(&a, 4, 1, pf);//⼆进制的形式写到⽂件中
fclose(pf);
pf = NULL;
return 0;
}
4. 文件的打开和关闭
4.1 流和标准流
4.1.1 流
我们程序的数据需要输出到各种外部设备,也需要从外部设备获取数据,不同的外部设备的输入输出操作各不相同,为了⽅便程序员对各种设备进行方便的操作,我们抽象出了流的概念,我们可以把流想象成流淌着字符的河。
C程序针对文件、画面、键盘等的数据输入输出操作都是通过流操作的。
一般情况下,我们要想向流里写数据,或者从流中读取数据,都是要打开流,然后操作。
在计算机科学中,流(Stream)是一个抽象的概念,用于表示数据的流动或传输过程。流通常被用来处理大量的数据,这些数据可能来自于文件、网络连接、用户输入或其他数据源。通过流,程序可以一次处理一小部分数据,而不是一次性加载整个数据集到内存中,这在处理大型文件或实时数据时特别有用。
流可以分为两种主要类型:输入流(Input Stream)和输出流(Output Stream)。
- 输入流:用于从数据源读取数据。当程序需要从文件、网络或其他来源读取数据时,它会打开一个输入流,并从这个流中读取数据。读取可以是一个字节一个字节地进行,也可以按照特定的块大小进行,这取决于流的实现和程序的需求。
- 输出流:用于向目标写入数据。当程序需要将数据保存到文件、发送到网络或进行其他形式的输出时,它会打开一个输出流,并将数据写入这个流。同样,写入也可以是一个字节一个字节地进行,或者按照更大的块进行。
在C语言中,文件操作实际上是通过文件流进行的。当你使用标准库函数(如fopen, fread, fwrite, fclose等)打开文件时,你实际上是在创建一个文件流。通过这个流,你可以读取或写入文件的内容。
除了文件流,C语言和其他高级语言还提供了其他类型的流,如内存流、网络流等。这些流允许程序以类似的方式处理不同类型的数据源和目标。
流的概念不仅限于C语言,它在许多编程语言中都是存在的,并且是实现高效数据处理和传输的关键工具之一。通过流,程序可以更加灵活和高效地处理大量数据,而不需要一次性加载所有数据到内存中。
4.1.2 标准流
那为什么我们从键盘输入数据,向屏幕上输出数据,并没有打开流呢?
那是因为C语言程序在启动的时候,默认打开了3个流:
• stdin - 标准输入流,在大多数的环境中从键盘输入,scanf函数就是从标准输入流中读取数据。
• stdout - 标准输出流,大多数的环境中输出至显示器界面,printf函数就是将信息输出到标准输出流中。
• stderr - 标准错误流,大多数环境中输出到显示器界面。
这是默认打开了这三个流,我们使用scanf、printf等函数就可以直接进行输入输出操作的。
stdin、stdout、stderr 三个流的类型是: FILE* ,通常称为文件指针。
C语言中,就是通过 FILE* 的文件指针来维护流的各种操作的。
4.2 文件指针
文件指针是一个指向文件流中的位置的指针,用于标识文件流中当前位置的对象。它使得文件操作能够顺序读写、定位读写以及随机读写。在C语言中,文件指针是一个指向FILE类型的指针,而在C++中,它是一个指向流streambuf类型的指针。
通过文件指针,我们可以对文件进行各种操作,如打开、读取、写入和关闭文件。当我们打开一个文件时,会获得一个文件指针,这个指针就代表了这个打开的文件。通过对这个文件指针进行操作,我们可以实现对文件的读、写、关闭等操作。
在C语言中,定义一个文件指针的一般形式为:FILE *指针变量标识符。其中,FILE是一个由系统定义的结构,它包含了文件名、文件状态以及文件当前位置等信息。当我们通过文件指针对文件进行读写操作时,实际上是通过这个结构中的信息来进行的。
例如,在C语言中,我们可以使用fopen函数打开一个文件并获取其文件指针,然后使用fread、fwrite等函数对文件进行读写操作,最后使用fclose函数关闭文件。
总的来说,文件指针是编程中处理文件的重要工具,它使得我们能够以更灵活和高效的方式对文件进行读写操作。
缓冲文件系统中,关键的概念是“文件类型指针”,简称“文件指针”。
每个被使用的文件都在内存中开辟了⼀个相应的文件信息区,用来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置等)。这些信息是保存在⼀个结构体变量中的。该结构体类型是由系统声明的,取名 FILE.
例如,VS2013 编译环境提供的 stdio.h 头文件中有以下的文件类型申明:
struct _iobuf {
char *_ptr;
int _cnt;
char *_base;
int _flag;
int _file;
int _charbuf;
int _bufsiz;
char *_tmpfname;
};
typedef struct _iobuf FILE;
不同的C编译器的FILE类型包含的内容不完全相同,但是大同小异。
每当打开一个文件的时候,系统会根据文件的情况⾃动创建⼀个FILE结构的变量,并填充其中的信息,使用者不必关心细节。
⼀般都是通过⼀个FILE的指针来维护这个FILE结构的变量,这样使⽤起来更加⽅便。
下面我们可以创建⼀个FILE*的指针变量:
FILE* pf;//⽂件指针变量
定义pf是⼀个指向FILE类型数据的指针变量。可以使pf指向某个文件的文件信息区(是⼀个结构体变量)。通过该文件信息区中的信息就能够访问该文件。也就是说,通过文件指针变量能够间接找到与它关联的文件。
4.3 文件的打开和关闭
文件在读写之前应该先打开文件,在使用结束之后应该关闭文件。
在编写程序的时候,在打开文件的同时,都会返回⼀个FILE*的指针变量指向该文件,也相当于建立了指针和文件的关系。
ANSI C 规定使用 fopen 函数来打开文件, fclose 来关闭文件。
//打开⽂件
FILE * fopen ( const char * filename, const char * mode );
//关闭⽂件
int fclose ( FILE * stream );
文件使用方式 | 含义 | 如果指定文件不存在 |
---|---|---|
“r”(只读) | 为了输入数据,打开⼀个已经存在的文本文件 | 出错 |
“w”(只写) | 为了输出数据,打开⼀个文本文件 | 建立⼀个新的文件 |
“a”(追加) | 向文本文件尾添加数据 | 建立⼀个新的文件 |
“rb”(只读) | 为了输入数据,打开一个二进制文件 | 出错 |
“wb”(只写) | 为了输出数据,打开一个二进制文件 | 建立一个新的文件 |
“ab”(追加) | 向一个二进制文件尾添加数据 | 建立一个新的文件 |
“r+”(读写) | 为了读和写,打开一个文本文件 | 出错 |
“w+”(读写) | 为了读和写,建议一个新的文件 | 建立一个新的文件 |
“a+”(读写) | 打开一个文件,在文件尾进行读写 | 建立一个新的文件 |
“rb+”(读写) | 为了读和写打开一个二进制文件 | 出错 |
“wb+”(读写) | 为了读和写,新建一个新的二进制文件 | 建立一个新的文件 |
“ab+”(读写) | 打开一个二进制文件,在文件尾进行读和写 | 建立一个新的文件 |
建立的新文件和代码在同一文件夹
实例代码:
/* fopen fclose example */
#include <stdio.h>
int main ()
{
FILE * pFile;
//打开⽂件
pFile = fopen ("myfile.txt","w");
//⽂件操作
if (pFile!=NULL)
{
fputs ("fopen example",pFile);
//关闭⽂件
fclose (pFile);
}
return 0;
}
那本期文章先到这里咯,一下学太多也消化不了哈哈哈
下期预告:
5. 文件的顺序读写
6. 文件的随机读写
7. 文件读取结束的判定
8. 文件缓冲区
欲知后事如何,且听下回分解~~~