NumPy中最重要的一个特点就是其n维数组对象,即ndarray(别名array)对象,该对象具有矢量算术能力和复杂的广播能力,可以执行一些科学计算。不同于Python内置的数组类型, array对象拥有对高维数组的处理能力,这也是数值计算中缺一不可的重要特性。
概念解答:
什么是Numpy的矢量运算能力?
Numpy的矢量运算能力是指它能够对数组中的每个元素执行相同的操作,而不需要编写循环。这种操作被称为矢量化操作,它不仅可以简化代码,还能显著提高性能。
元素级操作:Numpy允许你对数组的每个元素执行数学运算,如加法、减法、乘法和除法。这些操作会自动应用到数组的每个元素上。
import numpy as np
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])
c = a + b # 结果是 [5, 7, 9]
广播(Broadcasting):Numpy可以自动扩展数组的维度,使得不同形状的数组可以进行数学运算。这是通过“广播”机制实现的,它允许较小的数组沿着缺失的维度“广播”其值。
a = np.array([1, 2, 3])
b = np.array([[2], [3], [4]])
c = a * b # 结果是 [[2, 4, 6], [3, 6, 9], [4, 8, 12]]
聚合操作:Numpy提供了多种聚合函数,如sum、mean、max、min等,它们可以对数组的元素进行聚合计算。
a = np.array([1, 2, 3])
total = np.sum(a) # 结果是 6
布尔运算:Numpy支持布尔数组,可以进行元素级的布尔运算,如逻辑与(&)、逻辑或(|)和逻辑非(~)。
a = np.array([True, False, True])
b = np.array([True, True, False])
c = np.logical_and(a, b) # 结果是 [True, False, False]
矢量化的函数:Numpy提供了许多数学函数,如sin、cos、exp等,它们可以对数组的每个元素执行相应的数学运算。
a = np.array([0, np.pi/2, np.pi])
sine_values = np.sin(a) # 结果是 [0, 1, 0]
矩阵运算:Numpy的dot函数可以执行矩阵乘法,这是线性代数中的基本操作。
a = np.array([[1, 2], [3, 4]])
b = np.array([5, 6])
c = np.dot(a, b) # 结果是 [17, 39]
ndarray对象中定义了一些重要的属性,具体说明见下表。
属 性 | 说 明 |
ndarray.ndim | 数组轴的个数,比如二维数组有两个轴,它的ndim属性的值为2 |
ndarray.shape | 数组维度的元组,元组中各个元素表示每个维度上数组的大小。例如, 一个n行和m列的二维数组, 它的shape属性的值为(n,m) |
ndarray.size | 数组元素的总个数,等于shape属性中元组元素的乘积 |
ndarray.dtype | 描述数组中元素类型的对象,既可以使用标准的Python类型创建或指定,也可以使用NumPy特有的数据类型来指定,比如numpy.int32、numpy.float64等 |
ndarray.itemsize | 数组中每个元素占用的内存大小,单位为字节。例如,元素类型为float64的数组,该数组中各元素占用的内存大小为8字节,这相当于ndarray.dtype.itemsize |
需要注意的是,shape属性的值是一个元组,元组里面有多少个元素取决于数组的维度。 如果是一维数组,那么shape元组里面只有一个元素;如果是二维数组,那么 shape元组里面 有两个元素,依此类推。
表中罗列的属性比较抽象,不容易理解,为了让大家理解ndarray对象的属性,下面通 过画图的方式分别介绍一维数组、二维数组和三维数组的属性,具体如下图所示。
为了简化ndaray对象和数组维度元组(shape属性)的叫法,我们可把ndarray对象称为数组,数组维度元组称为形状。