Python---Numpy万字总结(1)

NumPy的应用(1)

Numpy 是一个开源的 Python 科学计算库,用于快速处理任意维度的数组。Numpy 支持常见的数组和矩阵操作,对于同样的数值计算任务,使用 NumPy 代码简洁,在性能上也远远优于原生 Python,而且数据量越大,NumPy 的优势就越明显。

NumPy 最为核心的数据类型是ndarray,使用ndarray可以处理一维、二维和多维数组,该对象相当于是一个快速而灵活的大数据容器。NumPy 底层代码使用 C 语言编写,解决了 GIL 的限制,ndarray在存取数据的时候,数据与数据的地址都是连续的,这确保了可以进行高效率的批量操作,性能上远远优于 Python 中的list;另一方面ndarray对象提供了更多的方法来处理数据。

准备工作

  1. 启动 JupyterLab

    jupyter lab
    

    提示:在启动 JupyterLab 之前,需要先安装好数据分析相关依赖项,包括三大库函数(Numpy、Pandas、Matplotlib)以及相关依赖项。建议下载 Anaconda,就可以无需单独安装,通过 Anaconda 的 Navigator 来启动。

  2. 导入

    import numpy as np
    import pandas as pd
    import matplotlib.pyplot as plt
    

    说明:若没有安装相关依赖库,可以在单元格中输入%pip install numpy并运行该单元格来安装 NumPy。也可以在单元格中输入%pip install numpy pandas matplotlib把 Python 数据分析三个核心的三方库都安装上。注意上面的代码,不仅导入了 NumPy,还将 pandas 和 matplotlib 库一并导入了。

创建数组对象

创建ndarray对象有很多种方法,下面则是一些常用方法。

方法一:使用array函数,通过list创建数组对象

代码:

array1 = np.array([1, 2, 3])
array1

输出:

array([1, 2, 3])

代码:

array2 = np.array([[1, 2], [3,4]])
array2

输出:

array([[1, 2],
       [3,4]])

方法二:使用arange函数,指定取值范围和跨度创建数组对象

代码:

array3 = np.arange(0, 10, 2)
array3

输出:

array([ 0,  2,  4,  6,  8])

方法三:使用linspace函数,用指定范围和元素个数创建数组对象,生成等差数列

代码:

array4 = np.linspace(-1, 1, 11)
array4

输出:

array([-1. , -0.8, -0.6, -0.4, -0.2,  0. ,  0.2,  0.4,  0.6,  0.8,  1. ])

方法四:使用logspace函数,生成等比数列

代码:

array5 = np.logspace(1, 10, num=10, base=2)
array5

注意:等比数列的起始值是 2 1 2^1 21,等比数列的终止值是 2 10 2^{10} 210num是元素的个数,base就是底数。

输出:

array([   2.,    4.,    8.,   16.,   32.,   64.,  128.,  256.,  512., 1024.])

方法五:通过fromstring函数从字符串提取数据创建数组对象

代码:

array6 = np.fromstring('1, 2, 3, 4, 5', sep=',', dtype='i8')
array6 

输出:

array([1, 2, 3, 4, 5])

方法六:通过fromiter函数从生成器(迭代器)中获取数据创建数组对象

代码:

def fib(how_many):
    a, b = 0, 1
    for _ in range(how_many):
        a, b = b, a + b
        yield a


gen = fib(20)
array7 = np.fromiter(gen, dtype='i8')
array7

输出:

array([   1,    1,    2,    3,    5,    8,   13,   21,   34,   55,   89,
        144,  233,  377,  610,  987, 1597, 2584, 4181, 6765])

方法七:使用numpy.random模块的函数生成随机数创建数组对象

产生10个 [ 0 , 1 ) [0, 1) [0,1)范围的随机小数,代码:

array8 = np.random.rand(10)
array8

输出:

array([0.45556132, 0.67871326, 0.4552213 , 0.96671509, 0.44086463,
       0.72650875, 0.79877188, 0.12153022, 0.24762739, 0.6669852 ])

产生10个 [ 1 , 100 ) [1, 100) [1,100)范围的随机整数,代码:

array9 = np.random.randint(1, 100, 10)
array9

输出:

array([29, 97, 87, 47, 39, 19, 71, 32, 79, 34])

产生20个 μ = 50 \small{\mu=50} μ=50 σ = 10 \small{\sigma=10} σ=10的正态分布随机数,代码:

array10 = np.random.normal(50, 10, 20)
array10

输出:

array([55.04155586, 46.43510797, 20.28371158, 62.67884053, 61.23185964,
       38.22682148, 53.17126151, 43.54741592, 36.11268017, 40.94086676,
       63.27911699, 46.92688903, 37.1593374 , 67.06525656, 67.47269463,
       23.37925889, 31.45312239, 48.34532466, 55.09180924, 47.95702787])

产生[0, 1)范围的随机小数构成的3行4列的二维数组,代码:

array11 = np.random.rand(3, 4)
array11

输出:

array([[0.54017809, 0.46797771, 0.78291445, 0.79501326],
       [0.93973783, 0.21434806, 0.03592874, 0.88838892],
       [0.84130479, 0.3566601 , 0.99935473, 0.26353598]])

产生[1, 100)范围的随机整数构成的三维数组,代码:

array12 = np.random.randint(1, 100, (3, 4, 5))
array12

输出:

array([[[94, 26, 49, 24, 43],
        [27, 27, 33, 98, 33],
        [13, 73,  6,  1, 77],
        [54, 32, 51, 86, 59]],

       [[62, 75, 62, 29, 87],
        [90, 26,  6, 79, 41],
        [31, 15, 32, 56, 64],
        [37, 84, 61, 71, 71]],

       [[45, 24, 78, 77, 41],
        [75, 37,  4, 74, 93],
        [ 1, 36, 36, 60, 43],
        [23, 84, 44, 89, 79]]])

方法八:创建全0、全1或指定元素的数组

使用zeros函数,代码:

array13 = np.zeros((3, 4))
array13

输出:

array([[0., 0., 0., 0.],
       [0., 0., 0., 0.],
       [0., 0., 0., 0.]])

使用ones函数,代码:

array14 = np.ones((3, 4))
array14

输出:

array([[1., 1., 1., 1.],
       [1., 1., 1., 1.],
       [1., 1., 1., 1.]])

使用full函数创建一个三行四列全为10的数二维数组。代码:

array15 = np.full((3, 4), 10)
array15

输出:

array([[10, 10, 10, 10],
       [10, 10, 10, 10],
       [10, 10, 10, 10]])

方法九:使用eye函数创建单位矩阵

代码:

np.eye(4)

输出:

array([[1., 0., 0., 0.],
       [0., 1., 0., 0.],
       [0., 0., 1., 0.],
       [0., 0., 0., 1.]])

方法十:读取图片获得对应的三维数组

代码:

array16 = plt.imread('abc/test.jpg')
array16

输出:

array([[[ 36,  33,  28],
        [ 36,  33,  28],
        [ 36,  33,  28],
        ...,
        [ 32,  31,  29],
        [ 32,  31,  27],
        [ 31,  32,  26]],

       [[ 37,  34,  29],
        [ 38,  35,  30],
        [ 38,  35,  30],
        ...,
        [ 31,  30,  28],
        [ 31,  30,  26],
        [ 30,  31,  25]],

       [[ 38,  35,  30],
        [ 38,  35,  30],
        [ 38,  35,  30],
        ...,
        [ 30,  29,  27],
        [ 30,  29,  25],
        [ 29,  30,  25]],

       ...,

       [[239, 178, 123],
        [237, 176, 121],
        [235, 174, 119],
        ...,
        [ 78,  68,  56],
        [ 75,  67,  54],
        [ 73,  65,  52]],

       [[238, 177, 120],
        [236, 175, 118],
        [234, 173, 116],
        ...,
        [ 82,  70,  58],
        [ 78,  68,  56],
        [ 75,  66,  51]],

       [[238, 176, 119],
        [236, 175, 118],
        [234, 173, 116],
        ...,
        [ 84,  70,  61],
        [ 81,  69,  57],
        [ 79,  67,  53]]], dtype=uint8)

说明:上面的代码读取了当前路径下abc目录中名为test.jpg 的图片文件,计算机系统中的图片通常由若干行若干列的像素点构成,而每个像素点又是由红绿蓝三原色构成的,刚好可以用三维数组来表示。读取图片用到了matplotlib库的imread函数。

数组对象的属性

size属性:获取数组元素个数。

代码:

array17 = np.arange(1, 100, 2)
array18 = np.random.rand(3, 4)
print(array16.size)
print(array17.size)
print(array18.size)

输出:

1125000
50
12

shape属性:获取数组的形状。

代码:

print(array16.shape)
print(array17.shape)
print(array18.shape)

输出:

(750, 500, 3)
(50,)
(3, 4)

dtype属性:获取数组元素的数据类型。

代码:

print(array16.dtype)
print(array17.dtype)
print(array18.dtype)

输出:

uint8
int64
float64

ndarray对象元素的数据类型可以参考如下所示的表格。
在这里插入图片描述

ndim属性:获取数组的维度。

代码:

print(array16.ndim)
print(array17.ndim)
print(array18.ndim)

输出:

3
1
2

itemsize属性:获取数组单个元素占用内存空间的字节数。

代码:

print(array16.itemsize)
print(array17.itemsize)
print(array18.itemsize)

输出:

1
8
8

nbytes属性:获取数组所有元素占用内存空间的字节数。

代码:

print(array16.nbytes)
print(array17.nbytes)
print(array18.nbytes)

输出:

1125000
400
96

数组的索引运算

和 Python 中的列表类似,NumPy 的ndarray对象可以进行索引和切片操作,通过索引可以获取或修改数组中的元素,通过切片操作可以取出数组的一部分,我们把切片操作也称为切片索引。

普通索引

类似于 Python 中list类型的索引运算。

代码:

array19 = np.arange(1, 10)
print(array19[0], array19[array19.size - 1])
print(array19[-array20.size], array19[-1])

输出:

1 9
1 9

代码:

array20 = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
array20[2]

输出:

array([7, 8, 9])

代码:

print(array20[0][0])
print(array20[-1][-1])

输出:

1
9

代码:

print(array20[1][1])
print(array20[1, 1])

输出:

5
5

代码:

array20[1][1] = 10
array20

输出:

array([[ 1,  2,  3],
       [ 4, 10,  6],
       [ 7,  8,  9]])

代码:

array20[1] = [10, 11, 12]
array20

输出:

array([[ 1,  2,  3],
       [10, 11, 12],
       [ 7,  8,  9]])
切片索引

切片索引是形如[开始索引:结束索引:跨度]的语法,通过指定开始索引(默认值无穷小)、结束索引(默认值无穷大)和跨度(默认值1),从数组中取出指定部分的元素并构成新的数组。因为开始索引、结束索引和步长都有默认值,所以它们都可以省略,如果不指定步长,第二个冒号也可以省略。一维数组的切片运算跟 Python 中的list类型的切片非常类似。

代码:

array20[:2, 1:]

输出:

array([[ 2,  3],
       [11, 12]])

代码:

array20[2, :]

输出:

array([7, 8, 9])

代码:

array20[2:, :]

输出:

array([[7, 8, 9]])

代码:

array20[:, :2]

输出:

array([[ 1,  2],
       [10, 11],
       [ 7,  8]])

代码:

array20[::2, ::2]

输出:

array([[1, 3],
       [7, 9]])

代码:

array20[::-2, ::-2]

输出:

array([[9, 7],
       [3, 1]])

关于数组的索引和切片运算,可以通过下面的两张图来加深理解,图片来自《利用Python进行数据分析》一书

图1:二维数组的普通索引

在这里插入图片描述

图2:二维数组的切片索引

在这里插入图片描述

花式索引

花式索引是用保存整数的数组充当一个数组的索引,这里所说的数组可以是 NumPy 的ndarray,也可以是 Python 中listtuple等可迭代类型,可以使用正向或负向索引。

代码:

array19[[0, 1, 1, -1, 4, -1]]

输出:

array([1, 2, 2, 9, 5, 9])

代码:

array20[[0, 2]]

输出:

array([[1, 2, 3],
       [7, 8, 9]])

代码:

array20[[0, 2], [1, 2]]

输出:

array([2, 9])

代码:

array20[[0, 2], 1]

输出:

array([2, 8])
布尔索引

布尔索引就是通过保存布尔值的数组充当一个数组的索引,布尔值为True的元素保留,布尔值为False的元素不会被选中。布尔值的数组可以手动构造,也可以通过关系运算来产生。

代码:

array19[[True, True, False, False, True, False, False, True, True]]

输出:

array([1, 2, 5, 8, 9])

代码:

array19 > 5

输出:

array([False, False, False, False, False,  True,  True,  True,  True])

代码:

~(array19 > 5)

输出:

array([ True,  True,  True,  True,  True, False, False, False, False])

代码:

array19[array20 > 5]

输出:

array([6, 7, 8, 9])

代码:

array19 % 2 == 0

输出:

array([False,  True, False,  True, False,  True, False,  True, False])

代码:

array19[array20 % 2 == 0]

输出:

array([2, 4, 6, 8])

代码:

(array19 > 5) & (array19 % 2 == 0)

输出:

array([False, False, False, False, False,  True, False,  True, False])

说明&运算符可以作用于两个布尔数组,如果两个数组对应元素都是True,那么运算的结果就是True,否则就是False,该运算符的运算规则类似于 Python 中的 and 运算符,只不过作用的对象是两个布尔数组。

代码:

array19[(array19 > 5) & (array19 % 2 == 0)]

输出:

array([6, 8])

代码:

array19[(array19 > 5) | (array19 % 2 == 0)]

输出:

array([2, 4, 6, 7, 8, 9])

说明|运算符可以作用于两个布尔数组,如果两个数组对应元素都是False,那么运算的结果就是False,否则就是True,该运算符的运算规则类似于 Python 中的 or 运算符,只不过作用的对象是两个布尔数组。

代码:

array20[array21 % 2 != 0]

输出:

array([1, 3, 5, 7, 9])

在Python中进行索引操作时,要注意索引从0开始,支持负索引和切片,适用于可迭代对象。列表等可变类型可进行赋值,而元组和字符串等不可变类型则只能读取。多维索引用于嵌套结构,布尔索引和列表推导可用于复杂操作。同时,注意索引越界会引发错误,且硬编码索引应避免,以提高代码的可读性和维护性。

案例:通过数组切片处理图像

学习基础知识总是比较枯燥且没有成就感的,所以我们还是来个案例为大家演示下上面学习的数组索引和切片操作到底有什么用。前面我们说到过,可以用三维数组来表示图像,那么通过图像对应的三维数组进行操作,就可以实现对图像的处理,如下所示。

读入图片创建三维数组对象。

image1 = plt.imread('man.png')
plt.imshow(image1)

在这里插入图片描述

对数组的0轴进行反向切片,实现图像的垂直翻转。

plt.imshow(image1[::-1])

在这里插入图片描述

对数组的1轴进行反向切片,实现图像的水平翻转。

plt.imshow(guido_image[:,::-1])

在这里插入图片描述

通过切片操作实现抠图,将其中一个人给抠出来。

plt.imshow(image1[30:350, 90:300])

在这里插入图片描述

通过切片操作实现降采样。

plt.imshow(image1[::10, ::10])

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/605889.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

温度表程序里的公式推算

今天要改个温度表的程序,但是好几年没搞过了。所以程序里面的各种数字怎么算出来的都忘记了。花了半天才想起来,所以记录在这里,下次再忘记了就来翻一下。。 下次应该看到这个能想起来的把。

【论文笔记】KAN: Kolmogorov-Arnold Networks 全新神经网络架构KAN,MLP的潜在替代者

KAN: Kolmogorov-Arnold Networks code:https://github.com/KindXiaoming/pykan Background ​ 多层感知机(MLP)是机器学习中拟合非线性函数的默认模型,在众多深度学习模型中被广泛的应用。但MLP存在很多明显的缺点:…

nginx--系统参数优化telenct

系统参数 在生产环境中,根据自己的需求在/etc/sysctl.conf来更改内核参数 net.ipv4.ip_nonlocal_bind 1 允许非本地IP地址socket监听 net.ipv4.ip_forward 1 开启IPv4转发 net.ipv4.tcp_timestamps 0 是否开启数据包时间戳 net.ipv4.tcp_tw_reuse 0 端⼝口复⽤…

ctfshow之_萌新web9至web10

一、访问在线靶场ctfshow 1、web9 如下图所示,进入_萌新赛的web9问题,题目提醒flag在config.php中: 如上图所示,可以get传参,且传入的参数需要正则匹配system、exec、highlight,且不区分大小写&#xff0…

分类任务的基础学习

1.什么是分类? 2.局限性: 当样本量逐渐变大的时候,准确率会下降——>因为线性回归曲线距离我们的原点越远,预测就会开始不准确,因为 x前面的倍数就会越来越小,这就导致了样本量变大,但是那些…

安卓开发--环境配置

本次项目选择使用 Andrio Studio 进行开发。虽然这款软件版本更新也很快。不过开发一款APP的技术流程是大差不差的。我几年前的安卓笔记放到现在还是能用。 现在CSDN网上写一个笔记留作以后参考,开始吧!!! 1 安装 Andrio Studio …

Jmeter性能测试(五)

一、Jmeter参数化常用方式 1、CSV 数据文件设置 2、查询数据库(JDBC Connection Configuration) 二、CSV 数据文件设置 1、准备一个txt文件(不需要写表头,直接写你要用的数据就行了,多个字段用英文逗号隔开) 2、添加一个CSV 数据文件设置(放全局最上…

Vue从入门到实战Day02

一、指令补充 1. 指令修饰符 通过 “.”指明一些指令后缀,不同后缀封装了不同的处理操作 -> 简化代码 键盘按键修饰符 如:keyup.enter -> 键盘回车监听 常用按键修饰符别名 别名修饰符键值修饰符对应按键.delete.8/.46回格 / 删除.tab.9制表.e…

01-单片机商业项目编程,从零搭建低功耗系统设计

一、引言 这是关于《单片机商业编程之从零搭建低功耗系统》的第一篇章,个人善忘,平常项目设计当中的一些思路,以前年轻的时候习惯性的录制成视频,也算是当作是自己的笔记,无奈现在喉咙实在扛不住,因此先尝试…

Linux下的I2C通信

I2C通信: 一.硬件初识: IIC(inter-intergrated-Circu):内部集成总线 四线通讯:SCL,SDA,GND,VCC,串行,半双工 I2C 总线是同步,串行,半双工通信总线。 I2C 总线由时钟线 SDA 和 SCL 两根信号线构成。并且都有上拉电阻。确保总线空闲状态为高电平。 I2C 总线支持多…

四川古力未来科技抖音小店:安全便捷购物新体验

在这个数字化快速发展的时代,网络购物已经成为人们生活中不可或缺的一部分。四川古力未来科技抖音小店以其高度的安全性,为广大消费者提供了一个值得信赖的购物平台。在这里,我们可以享受到安全便捷的购物体验,畅游科技的海洋。 一…

java回调机制

目录 一、简介二、示例2.1 同步回调2.2 异步回调2.3 二者区别 三、应用场景 一、简介 在Java中,回调是一种常见的编程模式,它允许一个对象将某个方法作为参数传递给另一个对象,以便在适当的时候调用该方法。 以类A调用类B方法为例: 在类A中…

CTF-reverse,逆向分析,对“左移4或右移4,即(x<<4) | (x >>4)的加密探讨

博主在刷题过程中遇上这样一个有意思的加密(如下图),苦苦思索其逆向运算,被硬控了很久,也没搜到什么资料来解释这个问题(也许是太简单??蒟蒻博主怀疑人生……) 经过博主不…

2024最新版JavaScript逆向爬虫教程-------基础篇之无限debugger的原理与绕过

目录 一、无限debugger的原理与绕过1.1 案例介绍1.2 实现原理1.3 绕过debugger方法1.3.1 禁用所有断点1.3.2 禁用局部断点1.3.3 替换文件1.3.4 函数置空与hook 二、补充2.1 改写JavaScript文件2.2 浏览器开发者工具中出现的VM开头的JS文件是什么? 一、无限debugger的…

正点原子Linux学习笔记(七)在 LCD 上显示 png 图片

在 LCD 上显示 png 图片 21.1 PNG 简介21.2 libpng 简介21.3 zlib 移植下载源码包编译源码安装目录下的文件夹介绍移植到开发板 21.4 libpng 移植下载源码包编译源码安装目录下的文件夹介绍移植到开发板 21.5 libpng 使用说明libpng 的数据结构创建和初始化 png_struct 对象创建…

win11个性化锁屏界面怎么关闭?

win11个性化锁屏界面关闭方法对于win11用户来说,关闭个性化锁屏界面是一个常见问题。本文将由php小编苹果详细介绍如何执行此操作,分步指导并提供操作截图。继续阅读以了解具体步骤。 win11个性化锁屏界面关闭方法 第一步,点击底部Windows图…

企信通_企信通短信群发平台

现代社会,随着互联网技术的快速发展,传统的营销方式已经无法满足企业对于市场开拓和客户沟通的需求。群发作为一种高效、低成本的营销手段,逐渐成为了众多企业的首选。而在众多群发平台中,嘀迈信息企信通公司凭借其稳定可靠的服务…

GM EPUB Reader Pro for Mac:专业电子书阅读工具

GM EPUB Reader Pro是一款适用于Mac的专业EPUB阅读软件。它为用户提供了优质的阅读体验和丰富的功能。 GM EPUB Reader Pro支持EPUB格式,这是一种广泛使用的电子书格式,常用于小说、教育书籍、期刊等。您可以通过该软件打开和阅读EPUB文件,享…

提取网页元数据的Python库之lassie使用详解

概要 Lassie是一个用于提取网页元数据的Python库,它能够智能地抓取网页的标题、描述、关键图像等内容。Lassie的设计目的是为了简化从各种类型的网页中提取关键信息的过程,适用于需要预览链接内容的应用场景。 安装 安装Lassie非常简单,可以通过Python的包管理器pip进行安…

WPS二次开发系列:一文快速了解WPS SDK功能场景

作者持续关注 WPS二次开发专题系列,持续为大家带来更多有价值的WPS开发技术细节,如果能够帮助到您,请帮忙来个一键三连,更多问题请联系我(QQ:250325397) 目录 SDK功能介绍 功能详解: 打开文档…