文件是数据的载体,程序可以从文件中读取数据,也可以将数据写 入文件中,本章重点介绍如何在Python中进行文件读写。
1 打开文件
我们在使用文件之前要先将文件打开,这通过open()函数实现。 open()函数的语法如下:
open()函数中的参数还有很多,这里介绍4个常用参数,这些参 数的含义如下。
1.file参数 file参数用于表示要打开的文件,可以是字符串或整数。如果file是 字符串,则表示文件名,文件名既可以是当前目录的相对路径,也可以 是绝对路径;如果file是整数,则表示一个已经打开的文件。
2.mode参数
mode参数用于设置文件打开模式,用字符串表示,例如rb表示以只 读模式打开二进制文件。用于设置文件打开模式的字符串中的每一个字 符都表示不同的含义,对这些字符的具体说明如下。
t:以文本文件模式打开文件。
b:以二进制文件模式打开文件。
r:以只读模式打开文件
w:以只写模式打开文件,不能读内容。如果文件不存在,则创建 文件;如果文件存在,则覆盖文件的内容。
x:以独占创建模式打开文件,如果文件不存在,则创建并以写入 模式打开;如果文件已存在,则引发FileExistsError异常。
a:以追加模式打开文件,不能读内容。如果文件不存在,则创建 文件;如果文件存在,则在文件末尾追加。
+:以更新(读写)模式打开文件,必须与r、w或a组合使用,才能 设置文件为读写模式。
这些字符可以进行组合,以表示不同类型的文件的打开模式,如下 表所示。
3.encoding参数
encoding用来指定打开文件时的文件编码,默认是UTF-8编码,主 要用于打开文本文件。
4.errors参数
errors参数用来指定在文本文件发生编码错误时如何处理。推荐erro rs参数的取值为'ignore',表示在遇到编码错误时忽略该错误,程序会继 续执行,不会退出。
示例代码如下:
通过Python指令运行文件,输出结果。
2 关闭文件
在打开文件后,如果不再使用该文件,则应该将其关闭,会用到cl ose()方法。
2.1 在finally代码块中关闭文件
对文件的操作往往会抛出异常,为了保证对文件的操作无论是正常 结束还异常结束,都能够关闭文件,我们应该将对close()方法的调用 放在异常处理的finally代码块中。
示例代码如下:
通过Python指令运行文件,输出结果:
2.2 在with as代码块中关闭文件
with as提供了一个代码块,在as后面声明一个资源变量,在with as 代码块结束之后自动释放资源。
3 读写文本文件
读写文本文件的相关方法如下。
read(size=-1):从文件中读取字符串,size限制读取的字符数,si ze=-1指对读取的字符数没有限制。
readline(size=-1):在读取到换行符或文件尾时返回单行字符串 。如果已经到文件尾,则返回一个空字符串。size是限制读取的字符数 ,size=-1表示没有限制。
readlines():读取文件数据到一个字符串列表中,每一行数据都 是列表的一个元素。
write(s):将字符串s写入文件中,并返回写入的字符数。
writelines(lines):向文件中写入一个字符串列表。不添加行分隔 符,因此通常为每一行末尾都提供行分隔符。
flush():刷新写缓冲区,在文件没有关闭的情况下将数据写入文 件中
4 动动手——复制文本文件
示例代码如下:
5 读写二进制文件
二进制文件的读写单位是字节,不需要考虑编码问题。二进制文件 的主要读写方法如下。
read(size=-1):从文件中读取字节,size限制读取的字节数,如 果size=-1,则读取全部字节。 readline(size=-1):从文件中读取并返回一行。size是限制读取的 行数,如果size=-1,则没有限制。
readlines():读取文件数据到一个字节列表中,每一行数据都是 列表的一个元素。
write(b):写入b字节,并返回写入的字节数。
writelines(lines):向文件中写入一个字节列表。不添加行分隔符 ,因此通常为每一行末尾都提供行分隔符。
flush():刷新写缓冲区,在文件没有关闭的情况下将数据写入文 件中。
6 动动手——复制二进制文件
下面给出一个文件复制示例。
7 练一练
1 请简述打开文件函数open()中几个常用参数的意义。
2 判断对错:(请在括号内打√或×,√表示正确,×表示错误)。
1)若文件打开模式为r+,则表示以只读模式打开文本文件,如果 文件不存在,则抛出异常。()
2)文件读取方法readline()会一次性读取文件中的所有数据。( )
3)文本文件写入方法write(s)会将字符串s写入文件中。()
4)进行文件写入时可以不用flush()方法,只要文件正常关闭, 则数据最终都被写入文件中()
5)文件可以分为:二进制文件和文本文件。图片jpgJPG图片文件 属性二进制文件,而Word属于文本文件。()
6)打开二进制文件时需要指定编码集。()
7)打开文件后,如果不再使用该文件,则应该关闭该文件。关闭 文件的过程可以在finally代码块中完成,也可以在with as代码块中实现 完成。()
8)with as代码块,可自动释放资源(包括关闭文件的操作),它 可以替代finally代码块,优化代码结构,并提高其可读性。()