目录
1.前言
2.Python中打开文件操作
3.初步认识NumPy库
4.使用NumPy库
5.NumPy库中的维度
6.array函数
7.arange函数
8.linspace函数
9.logspace函数
10.zeros函数
11.eye函数
前言
NumPy库是一个开源的Python科学计算库,它提供了高性能的多维数组对象、派生对象(如掩码数组、矩阵)以及用于快速操作数组的各种例程,包括逻辑、形状操作、离散傅立叶变换、基本线性代数、基本统计运算、随机模拟等操作,本系列博客讲重点对NumP库的函数已经操作进行讲解
Python中打开文件操作
本系列是对NumPy库的讲解,为什么第一小节却是使用Python打开文件?这是因为在数学建模中,数据的提供往往是Excel格式,要对数据进行操作之前,我们得先了解在Python中基本的文件操作:
1.open函数用于打开文件:
1.Path为文件路径
2.mode指定模式,默认为r:
模式指令 | 备注 |
x | 创建文件,若文件已存在则失败 |
a | 写入模式,文件存在则在末尾追加 |
r | 读取模式 |
w | 写入模式,并线截断文件 |
b | 二进制模式 |
t | 文本模式 |
+ | 更新磁盘文件,读写并且读入 |
3.buffering为缓冲区(内存的读写速度快于外设,所以大部分情况不用设,即不大于0)
4.encoding为编码方式
filePtr = open(path,mode='r',buffering=-1,encoding='utf-8-sig')
//定义一个文件指针filePtr指向打开的文件
2.seek函数用于移动文件的读取指针到指定位置。seek函数需要使用文件对象进行调用,无返回值:
value = 3
#定义变量value移动光标至3的位置
type.seek(0)
#移动到文件头位置
type.seek(value)
#将文件读取指针移动到文件的第p个字节处,表示绝对位置
type.seek(value, 1)
#在当前位置的基础上,将文件读取指针移动p个字节,表示相对位置
type.seek(value, 2)
#在文件尾的基础上,将文件读取指针移动p个字节,表示相对位置
3.read函数用于从文件光标位置读取字节:
value_A = type.read(5)
#表示读取五个字符赋值给value_A
value_B = type.read()
#无参数表示读取至文件结束
4.readline函数用于一次读取文件一行内容,以字符串的形式存储:
value_A = type.readline()
#表示读取文件一行内容
value_B = type.readline()[:-1]
#使用切片可控制读取到的位置,[:-1]代表该行的末尾
5.readlines函数用于读取文件所有行,以列表的形式存储:
value_A = type.readlines()
#表示读取文件所有行
value_B = type.readlines()[:5]
#使用切片可控制读取到的位置,[:5]代表读取至第五行
6.split函数用于分割数据:
1.格式:split('text',value)
2.以text内容分割内容,分割次数为value
3.value的默认值为 -1,即分割所有出现次数
4.列表格式不能使用split函数分割,只能字符串格式才能分割
value_A = type.readline().split(',')
#表示以逗号分割所读取到的行内容
value_B = type.readline().split(',',3)
#表示以逗号分割三次所读取到的行内容
7.strip函数用于删除两侧字符:
1.格式:strip(value)
2.当value为空时,代表删除头尾字符(换行,回车,制表符,空格)
3.不为空则代表删除头尾的value值
value_A = type.strip(',')
#代表删除头尾的逗号字符
value_B = type.strip()
#代表删除头尾的换行,回车,制表符和空格字符
8.lstrip函数用于删除左侧字符:
1.格式:lstrip(value)
2.当value为空时,代表删除开头字符(换行,回车,制表符,空格)
3.不为空则代表删除开头的value值
value_A = type.lstrip(',')
#代表删除开头的逗号字符
value_B = type.lstrip()
#代表删除开头的换行,回车,制表符和空格字符
9.rstrip函数用于删除右侧字符:
1.格式:rstrip(value)
2.当value为空时,代表删除末尾字符(换行,回车,制表符,空格)
3.不为空则代表删除末尾的value值
value_A = type.rstrip(',')
#代表删除末尾的逗号字符
value_B = type.rstrip()
#代表删除末尾的换行,回车,制表符和空格字符
初步认识NumPy库
NumPy库主要的功能之一用来操作数组和矩阵。是科学计算、深度学习等高端领域的必备工具。在使用TensorFlow、Caffe框架训练神经网络模型时,需要进行大量复杂的运算,可以直接调用NumPy里面的API,而且NumPy还包含了很多使用的数学函数,覆盖了很多的数学领域,比如,线性代数、傅里叶变换、随机数生成。在数学建模比赛中,你还可以认为Python + NumPy == Matlab
图1.动手学NumPy库
使用NumPy库
使用Numpy库前需要导入Numpy库
import numpy as _numpy #导入numpy库并取别名为_numpy
NumPy库中的维度
在介绍NumPy库的操作前,我们需要了解NumPy中的维度。Numpy中维度就是平常所说的一维(只有x轴)、二维(x、y轴)、三维(x、y、z轴)
#一维使用print输出后有一对花括号 [ ]
#二维使用print输出后有两对花括号 [ [] ]
#三维使用print输出后有三对花括号[ [ [] ] ]
array函数
array函数用于将列表或元组转换为数组
array(接收对象,dtype = 转换后数据类型,copy = True,order = 'K',subok = False,ndmin = 0)
参数 | 备注 |
接收对象 | 可为公开数组接口的任何对象,__array__方法返回数组的对象,或任何(嵌套)序列 |
dtype | 数组所需的数据类型。如果没有给出,那么类型将被确定为保持序列中的对象所需的最小类型 |
copy | 数组所需的数据类型。如果没有给出,那么类型将被确定为保持序列中的对象所需的最小类型 |
order | 指定阵列的内存布局。如果接收对象不是数组,则新创建的数组将按C顺序排列(行主要),除非指定了'F',在这种情况下,它将采用Fortran顺序(专业列)。如果object是一个数组,则以下成立。 {'K','A','C','F'},可选 |
subok | 如果为True,则子类将被传递,否则返回的数组将被强制为基类数组(默认) |
ndmin | 指定结果数组应具有的最小维数。根据需要,将根据需要预先设置形状 |
返回值 | 满足要求的数组对象 |
表1.array函数参数表
测试用例:
s1 = [1,2,3,10]
#创建一维列表s1
a1 = _numpy.array(s1,dtype = int)
#将列表s1转换为数组,数据类型为int型
s2 = [[1,2,3,10]]
#创建二维列表s2
a2 = _numpy.array(s2,dtype = int)
#将列表s1转换为数组,数据类型为int型
tp = (2,4,6,9,4)
创建元组tp
a3 = _numpy.array(tp,dtype = float)
#将列表a2转换为数组,数据类型为flosr型
#s1.dtype s1.size s1.itemsize s1.ndim s1.shape
#查看数组类型 查看元素个数 查看元素大小 查看数组维度 查看数组结构
arange函数
arange函数用于生成一维数组
arange([start , ],stop[ , step ,],stype = None)
参数 | 备注 |
start | 代表初始值,默认从0开始 |
stop | 代表终止值,必填参数 |
step | 代表步长,默认为1 |
表2.arange函数参数表
测试用例:
_numpy.arange(10)
#array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
_numpy.arange(5,10)
#array([5, 6, 7, 8, 9])
_numpy.arange(5,10,2)
#array([5, 7, 9])
#以上分别省略了初始值和步长
linspace函数
linspace函数用于生成一个一维数组,其数据是一个等差数列
linspace(start,stop,num = 50,endpoint = True,retstep = False,dtype = None,axis = 0)
参数 | 备注 |
start | 代表初始值,必填参数 |
stop | 代表终止值,必填参数 |
num | 代表生成数据的个数,默认为50 |
endpoint | 代表是否包含终止值,默认为True |
retstep | 代表是否显示步长,默认为False |
dtype | 代表数据类型 |
axis | 代表轴向,默认为0,代表沿X轴 |
表3.linspace函数参数表
测试用例:
_numpy.linspace(10,20,10)
#array([10. , 11.11111111, 12.22222222, 13.33333333, 14.44444444,
15.55555556, 16.66666667, 17.77777778, 18.88888889, 20. ])
_numpy.linspace(10,20,10,endpoint = False)
#array([10., 11., 12., 13., 14., 15., 16., 17., 18., 19.])
_numpy.linspace(10,20,10,endpoint = False,retstep = True)
#(array([10., 11., 12., 13., 14., 15., 16., 17., 18., 19.]), 1.0)
_numpy.linspace(10,20,10,endpoint = True,retstep = True,dtype = int)
#(array([10, 11, 12, 13, 14, 15, 16, 17, 18, 20]), 1.1111111111111112)
#最后两句代码显示的步长不同,但是数组相同。是因为dtype为int类型,所以小数强转为int类型
logspace函数
logspace函数用于生成一个一维数组,其数据是一个等比数列
logspace(start,stop,num = 50,endpoint = True,base = 10.0,dtype = None,axis = 0)
参数 | 备注 |
start | 代表初始值,必填参数 |
stop | 代表终止值,必填参数 |
num | 表生成数据的个数,默认为50 |
endpoint | 代表是否包含终止值,默认为True |
base | 代表底数,默认为10.0 |
dtype | 代表数据类型 |
axis | 代表轴向,默认为0,代表沿X轴 |
表4. logspace函数参数表
_numpy.logspace(10,20,5)
#array([1.00000000e+10, 3.16227766e+12, 1.00000000e+15, 3.16227766e+17,1.00000000e+20])
_numpy.logspace(10,20,5,endpoint = False)
#array([1.e+10, 1.e+12, 1.e+14, 1.e+16, 1.e+18])
_numpy.logspace(10,20,5,endpoint = False,base= 100.0)
#array([1.e+20, 1.e+24, 1.e+28, 1.e+32, 1.e+36])
#底数为100
_numpy.logspace(10,20,5,endpoint = True,base = 10.0,dtype = int,axis = 0)
#array([-2147483648, -2147483648, -2147483648, -2147483648, -2147483648])
#底数为10
zeros函数
zeros函数用于创建一个元素全为零的数组
zeros(shape,dtype = float,order = 'C')
参数 | 备注 |
shape | 代表数组尺寸,可以是数值或元组 |
dtype | 代表数组中的元素的数据类型,默认为float |
order | 代表存储多维数组时,是列优先'F'还是行优先'C',默认为行优先 |
shape | 代表数组尺寸,故可以使用[]或()分别代表列表或元组的尺寸 |
表5. zeros函数参数表
_numpy.zeros((2,2))
#array([[0., 0.],
[0., 0.]])
_numpy.zeros([2,2])
#array([[0., 0.],
[0., 0.]])
_numpy.zeros((2,2),dtype = int)
#array([[0, 0],
[0, 0]])
#与前两个元素类型不同
_numpy.zeros((3,5),dtype = int,order = 'F')
#array([[0, 0, 0, 0, 0],
[0, 0, 0, 0, 0],
[0, 0, 0, 0, 0]])
PS:当shape为[]或()时,可以传入多个数值,如_numpy.zeros((2,2,2)),代表2个3维数组,其元素含有2行2列。总结:当传入的数值大于2时,每增加一个数值代表维度加一,而最终的数字个数由前两个数字综合确定
eye函数
eye函数用于创建元素中一个对角线全为一的数组矩阵
eye(N,M = None,k = 0,btype = < class 'float' >,order = 'C')
参数 | 备注 |
N | 代表行数 |
M | 代表列数 |
k | 代表对角线元素个数,默认为0 |
dtype | 代表数组中元素的数据类型,默认为float |
order | 代表存储多维数组时,是列优先'F'还是行优先'C',默认为行优先 |
表5. eye函数参数表
_numpy.eye(3,3)
#array([[1., 0., 0.],
[0., 1., 0.],
[0., 0., 1.]])
_numpy.eye(3,3,dtype = int)
#array([[1, 0, 0],
[0, 1, 0],
[0, 0, 1]])
_numpy.diag([3,4,5])
#array([[3, 0, 0],
[0, 4, 0],
[0, 0, 5]])
_numpy.diag((3,4,5),1)
array([[0, 3, 0, 0],
[0, 0, 4, 0],
[0, 0, 0, 5],
[0, 0, 0, 0]])
_numpy.diag((3,4,5),-1)
#array([[0, 0, 0, 0],
[3, 0, 0, 0],
[0, 4, 0, 0],
[0, 0, 5, 0]])