【数据分析(一)】初探 Numpy

目录

  • 前言
  • 1. 一维 array 的生成
  • 2. 一维 array 的基本操作
    • 2.1. 查看属性
    • 2.2. 花式索引
    • 2.3. 条件筛查
    • 2.4. 数据统计
  • 3. n 维 array 的生成
  • 4. n 维 array 的基本操作
    • 4.1. 查看属性
    • 4.2. 查询和切片
    • 4.3. 花式索引
    • 4.4. 矩阵

前言

  NumpyPython的常用开源数值计算扩展库,用于高效存储和处理大型矩阵。本文主要介绍Numpy数组array的操作及其相关函数的使用。

  以下对Numpy库函数的介绍中,已传入的参数为默认值,并且无返回值的函数不会以赋值形式演示。
  

1. 一维 array 的生成

  • array(p_object, dtype)引用一个列表元组,生成类型dtype的一维数组
  • arange(start, stop, step):生成相当于array(range(start, stop, step))整数序列
  • linspace(start, stop, num=50, endpoint=True, retstep=False, dtype='float64'):生成长度num类型dtype,在[start, stop]上的等差序列endpoint表示区间右端是否封闭retstep=True时则返回一个元组(array, step),即等差数列和步长
  • empty(shape, dtype='float64'):生成长度shape类型dtype,元素的全为空值的一维数组
  • zeros(shape, dtype='float64'):生成长度shape类型dtype,元素的全为0的一维数组
  • ones(shape, dtype='float64'):生成*长度shape类型dtype,元素的值**全为1的一维数组
  • fill(value):将value转换为原数组的数据类型后,把原数组的元素的全部填充value
  • random.rand(d):在区间[0, 1)生成随机浮点数,返回长度d的一维数组
  • random.randn(d):生成服从正态分布随机浮点数,返回长度d的一维数组
  • random.randint(low, high, size, dtype='int'):在区间[low, high)生成类型dtype随机数,返回长度size的一维数组
import numpy as np

# 引用创建
l = [1, 2, 3, 4]
a = np.array(l, dtype='float')  # [1. 2. 3. 4.]

# 整数序列
a = np.arange(1, 10, 2)         # [1 3 5 7 9]

# 等差数列
a = np.linspace(1, 10, 4)       # [ 1.  4.  7. 10.]

# 全0填充 
a = np.zeros(3, dtype='bool')   # [False False False]

# 全1填充
a = np.ones(4, dtype='int')     # [1 1 1 1]

# 任意值填充
a.fill(2.5)                     # [2 2 2 2]

# 随机浮点数
a = np.random.rand(3)           # [0.39581995 0.13435102 0.31592101]

# 随机正态分布值
a = np.random.randn(3)          # [ 1.62916156  0.44159883 -1.85375949]

# 随机数
a = np.random.randint(1, 3, 5)  # [1 1 2 1 1]

  

2. 一维 array 的基本操作

2.1. 查看属性

import numpy as np
a = np.array([1, 2, 3, 4])

# 查看类型:即元素的数据类型
print(a.dtype)              # int32

# 查看维度
print(a.ndim)               # 1

# 查看长度:即元素数目
print(a.size)               # 4

# 查看尺寸:返回一个元组,值为对应维度的元素数目
print(a.shape)              # (4,)

# 类型转换
# a = np.array(a, dtype='float64')
a = a.astype('float64')     # [1. 2. 3. 4.]

  

2.2. 花式索引

import numpy as np
a = np.arange(1, 20, 2)
'''[ 1  3  5  7  9 11 13 15 17 19]'''

# 索引列表:获取对应索引的元素
print(a[[2, 2, -3, 6, -1]])
'''[ 5  5 15 13 19]'''

# 布尔数组:和numpy数组长度相等,获取布尔值为True的对应位置上的元素
print(a[np.array([1, 1, 0, 1, 0, 1, 1, 0, 1, 0], dtype='bool')])
'''[ 1  3  7 11 13 17]'''

  

2.3. 条件筛查

import numpy as np
a = np.arange(1, 20, 2)
'''[ 1  3  5  7  9 11 13 15 17 19]'''

# 对数组中的所有元素做条件判断,并在对应位置返回布尔值
print(a > 10)
'''[False False False False False  True  True  True  True  True]'''

# 以元组形式,返回所有符合条件的元素的索引
print(np.where(a > 10))
'''(array([5, 6, 7, 8, 9], dtype=int64),)'''

# 返回所有符合条件的元素的数组
print(a[a > 10])
print(a[np.where(a > 10)])
'''[11 13 15 17 19]'''

  

2.4. 数据统计

import numpy as np
a = np.array([-5, -2, 3, 1, 4])

'''排列'''
# 正序排列
b = np.sort(a)      # [-5 -2  1  3  4]

# 排列后的元素在原数组中的索引
b = np.argsort(a)   # [0 1 3 2 4]


'''运算'''
# 应用于所有元素
b = a+1             # [-4 -1  4  2  5]

# 应用于对应元素
b = b*a             # [20  2 12  2 20]

# 绝对值
abs = np.abs(a)     # [5 2 3 1 4]

# 指数
exp = np.exp(a)     # [6.73794700e-03 1.35335283e-01 2.00855369e+01 2.71828183e+00 5.45981500e+01]


'''统计'''
# 求和
# s = a.sum()
s = np.sum(a)       # 1

# 最小值
# m = a.min()
m = np.min(a)       # -5

# 最大值
# M = a.max()
M = np.max(a)       # 4

# 均值
# avg = a.mean()
avg = np.mean(a)    # 0.2

# 中值
#
mid = np.median(a)  # 1.0

# 累计和(前缀和)
cs = np.cumsum(a)   # [-5 -7 -4 -3  1]

# 标准差
# std = a.std()
std = np.std(a)     # 3.3105890714493698

  

3. n 维 array 的生成

  • array(p_object, dtype)引用一个由 n个相同长度的列表元组 构成的元组,生成类型dtypen维数组
  • empty((*dn), dtype='float64'):生成尺寸(d0, d1, ..., dn)类型dtype,元素的全为空值n维数组
  • zeros((*dn), dtype='float64'):生成尺寸(d0, d1, ..., dn)类型dtype,元素的全为0n维数组
  • ones((*dn), dtype='float64'):生成尺寸(d0, d1, ..., dn)类型dtype,元素的全为1n维数组
  • fill(value):将value转换为原数组的数据类型后,把原数组的元素的全部填充value
  • random.rand(*dn):在区间[0, 1)生成随机浮点数,返回尺寸(d0, d1, ..., dn)n维数组
  • random.randn(*dn):生成服从正态分布随机浮点数,返回尺寸(d0, d1, ..., dn)n维数组
  • random.randint(low, high, (*dn), dtype='int'):在区间[low, high)生成类型dtype随机数,返回尺寸(d0, d1, ..., dn)n维数组
import numpy as np

# 引用创建
a = np.array(([1, 2, 3, 4], (5, 6, 7, 8)))
'''
[[1 2 3 4]
 [5 6 7 8]]
'''

# 全0填充
a = np.zeros((2, 4))
'''
[[0. 0. 0. 0.]
 [0. 0. 0. 0.]]
'''

# 全1填充
a = np.ones((2, 4))
'''
[[1. 1. 1. 1.]
 [1. 1. 1. 1.]]
'''

# 任意值填充
a.fill(False)
'''
[[0. 0. 0. 0.]
 [0. 0. 0. 0.]]
'''

# 随机浮点数
a = np.random.rand(2, 2)
'''
[[0.11188812 0.83587679]
 [0.98262527 0.79479766]]
'''

# 随机正态分布值
a = np.random.randn(2, 2)
'''
[[-0.79453966 -1.5958028 ]
 [ 0.89898492 -0.9779685 ]]
'''

# 随机数
a = np.random.randint(1, 10, (2, 4))
'''
[[9 7 3 9]
 [3 7 4 8]]
'''

  

4. n 维 array 的基本操作

  以二维数组为例。

4.1. 查看属性

import numpy as np
a = np.array(([1, 2, 3, 4], (5, 6, 7, 8)))
'''
[[1 2 3 4]
 [5 6 7 8]]
'''

# 查看类型
print(a.dtype)              # int32

# 查看维度
print(a.ndim)               # 2

# 查看数目
print(a.size)               # 8

# 查看尺寸
print(a.shape)              # (2, 4)

# 对数组所有元素进行运算
a = a+1
'''
[[2 3 4 5]
 [6 7 8 9]]
'''

# 两个数组的对应元素进行运算
a = a*(a-1)
'''
[[ 2  6 12 20]
 [30 42 56 72]]
'''

  

4.2. 查询和切片

import numpy as np
a = np.array(([1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12], [13, 14, 15, 16]))
'''
[[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]
 [13 14 15 16]]
'''
print(a)
# 单元查询:对于a[x, y],x是行索引,y是列索引
print(a[1, 0])              # 5

# 单行查询
print(a[1])                 # [5 6 7 8]

# 单列查询
print(a[:, 1])              # [ 2  6 10 14]

# 连续区域切片
print(a[1:3, 1:3])
'''
[[ 6  7]
 [10 11]]
'''

# 离散区域切片
print(a[1::2, 1::2])
'''
[[ 6  8]
 [14 16]]
'''

# 不完全索引:只给出行索引范围时,默认对整行切片
print(a[:3])
'''
[[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]]
'''

  
  与列表不同的是,Numpy数组的切片是对原数组的引用,即它们共同指向一处内存空间,这意味元素的修改会同时作用到数组和它的切片上。可以用copy()方法进行拷贝,申请新的内存。

import numpy as np

a = np.array([1, 2, 3, 4])
b = a[1: 3]
b[0] = '0'
print(a)    # [1 0 3 4]

a = [1, 2, 3, 4]
b = a[1: 3]
b[0] = '0'
print(a)    # [1, 2, 3, 4]

  

4.3. 花式索引

  花式索引是对原数组的拷贝而非引用。

import numpy as np
a = np.array(([1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12], [13, 14, 15, 16]))
'''
[[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]
 [13 14 15 16]]
'''

# 索引列表
print(a[[0, 1, 2, 3], [0, 1, 2, 3]])
'''[ 1  6 11 16]'''

# 布尔数组:需要指定列
mask = np.array([0, 1, 0, 1], dtype='bool')
print(a[mask])
'''
[[ 5  6  7  8]
 [13 14 15 16]]
'''
print(a[mask, 1])   # [ 6 14]
print(a[1, mask])   # [6 8]

# 配合切片使用花式索引
print(a[1: 3, [0, 3]])
'''
[[ 5  8]
 [ 9 12]]
'''
'''

  

4.4. 矩阵

import numpy as np
x = np.array([1, 3, 2, 4, 6, 9])
y = np.array([13, 25, 37, 42, 54, 69])

# 相关系数矩阵
cov = np.cov(x, y)
'''
[[  8.56666667  55.        ]
 [ 55.         400.8       ]]
'''

# 变形
x = x.reshape(2, 3)
'''
[[1 3 2]
 [4 6 9]]
'''
y.shape = (2, 3)
print(y)                # 原矩阵发生改变
'''
[[13 25 37]
 [42 54 69]]
'''

# 转置
# x_T = x.T
x_T = x.transpose()     # 原矩阵不发生改变
'''
[[1 4]
 [3 6]
 [2 9]]
'''

# 连接
'''沿行方向,即第一维(默认)'''
# z = np.vstack((x, y))
z = np.concatenate((x, y), axis=0)
'''
[[ 1  3  2]
 [ 4  6  9]
 [13 25 37]
 [42 54 69]]
'''

'''沿列方向,即第二维'''
# z = np.hstack((x, y))
z = np.concatenate((x, y), axis=1)
'''
[[ 1  3  2 13 25 37]
 [ 4  6  9 42 54 69]]
'''

'''沿垂直方向,即第三维'''
z = np.array((x, y))
print(z)
'''
[[[ 1  3  2]
  [ 4  6  9]]

 [[13 25 37]
  [42 54 69]]]
'''
z = np.dstack((x, y))
'''
[[[ 1 13]
  [ 3 25]
  [ 2 37]]

 [[ 4 42]
  [ 6 54]
  [ 9 69]]]
'''

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/951892.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode:108.将有序数组转换为二叉搜索树

跟着carl学算法,本系列博客仅做个人记录,建议大家都去看carl本人的博客,写的真的很好的! 代码随想录 LeetCode:108.将有序数组转换为二叉搜索树 给你一个整数数组 nums ,其中元素已经按 升序 排列&#xff…

双因素身份验证技术在NPI区域邮件安全管控上的解决思路

在制造业中,NPI(New Product Introduction,新产品导入)区域是指专门负责新产品从概念到市场推出全过程的部门或团队。NPI 的目标是确保新产品能够高效、高质量地投入生产,并顺利满足市场需求。在支撑企业持续创新和竞争…

基于 GEE 下载逐年 MODIS 地表温度 LST 数据

目录 1 地表温度(LST) 2 数据准备 3 代码实现 3.1 加载研究区与数据集 3.2 数据预处理与标准化 3.3 逐年批量导出 3.4 可视化结果 4 运行结果 5 完整代码 1 地表温度(LST) 在遥感领域,地表温度(L…

Web渗透测试之XSS跨站脚本 防御[WAF]绕过手法

目录 XSS防御绕过汇总 参考这篇文章绕过 XSS payload XSS防御绕过汇总 服务端知道有网络攻击或者xss攻 Html 通过js代码 标签属性等手段进行一个过滤 不允许出现css的payload 前端过滤 我可以在抓包工具里面修改 抓包工具是不受前端的防御 也 就是浏览器 服务端过滤…

4G、5G移远模块SIM卡热插拔问题解决

4G、5G移远模块SIM卡热插拔问题解决 1、开发环境2、问题阐述3、开启模块热插拔功能4、问题解决5、quectelCM工具(热插拔)6、思路1、开发环境 系统: ubuntu20.04 拨号工具:quectelCM 模块型号:ec20、rm500u 开发平台:RK35XX系列 2、问题阐述 SIM卡热插拔功能已开启,拔掉…

Win11家庭版转专业版

Win11家庭版转专业版(亲测有效) 第一步 【断网】输入这个密钥: R8NJ8-9X7PV-C7RCR-F3J9X-KQBP6 第二步 点击下一步会自动重启 第三步 【联网】输入这个密钥: F3NWX-VFMFC-MHYYF-BCJ3K-QV66Y 注意 两次输入密钥的地方一致 …

浅析大语言模型安全和隐私保护国内外标准和政策

过去两年,大模型技术已经普及并逐步渗透到各行各业,2025年注定是大模型应用井喷式发展的一年,AI在快速发展的同时,其带来的安全风险也逐渐凸显。人工智能系统的安全性和隐私保护已经成为社会关注的重点。 附下载:600多…

GelSight Mini视触觉传感器凝胶触头升级:增加40%耐用性,拓展机器人与触觉AI 应用边界

马萨诸塞州沃尔瑟姆-2025年1月6日-触觉智能技术领军企业Gelsight宣布,旗下Gelsight Mini视触觉传感器迎来凝胶触头的更新。经内部测试,新Gel凝胶触头耐用性提升40%,外观与触感与原凝胶触头保持一致。此次升级有效满足了客户在机器人应用中对设…

使用 Docker 安装 Maven 私服 Nexus3

在现代软件开发中,私有仓库是企业管理和分发内部依赖的重要工具,能够提高开发效率、加强依赖管理并确保构建的稳定性。Nexus Repository Manager 作为市场上常见的私服解决方案,不仅支持 Maven,还支持 npm、PyPI 等多种格式&#…

opencv 学习(3)

文章目录 画直线画圆画矩形画多边形文字绘制画板 本部分图形绘制 本节内容比较简单 直接上代码 画直线 import cv2 import numpy as np## 本节画直线## line 参数介绍 ## image 在那个图像上面 画线 ## 开始点借宿点 指定先的开始和结束的位置 ## 颜色 线宽 线性 ## shift…

Java-数据结构-栈与队列(StackQueue)

一、栈(Stack) ① 栈的概念 栈是一种特殊的线性表,它只允许固定一端进行"插入元素"和"删除元素"的操作,这固定的一端被称作"栈顶",对应的另一端就被称做"栈底"。 📚 栈中的元素遵循后…

带格式 pdf 翻译

支持 openAI 接口,国内 deepseek 接口兼容 openAI 接口, deepseek api 又非常便宜 https://pdf2zh.com/ https://github.com/Byaidu/PDFMathTranslate

【如何从0到1设计测试用例使用Fiddler完成弱网测试】

🌈个人主页:努力学编程’ ⛅个人推荐: c语言从初阶到进阶 JavaEE详解 数据结构 ⚡学好数据结构,刷题刻不容缓:点击一起刷题 🌙心灵鸡汤:总有人要赢,为什么不能是我呢 ⭐⭐⭐测试用…

基础项目实战——贪吃蛇(c++)

目录 前言一、 游戏总体框架二、地图绘制三、光标隐藏四、地图定义五、蛇体定义六、蛇体绘制七、蛇体移动八、频率控制九、边界检测十、游戏失败十一、蛇体转向十二、食物生成十三、食物碰撞十四、整体代码十五、结语 前言 各位小伙伴们好久不见,前段时间非常的忙很…

排序:插入、选择、交换、归并排序

排序 :所谓排序,就是使一串记录,按照其中的某个或某些关键字的大小,递增或递减的排列起来的操作。 稳定性 :假定在待排序的记录序列中,存在多个具有相同的关键字的记录,若经过排序,…

Windows service运行Django项目

系统:Windows Service 软件:nssm,nginx 配置Django项目 1、把Django项目的静态文件整理到staticfiles文件夹中 注:settings中的设置 STATIC_URL /static/ STATIC_ROOT os.path.join(BASE_DIR, staticfiles/) STATICFILES_DI…

comfyui精准作图之gligen

简介 在 Stable Diffusion(SD)中,GLIGEN 是一种用于增强文本到图像生成模型可控性的技术。它通过在现有的预训练扩散模型(如 Stable Diffusion)基础上,引入额外的定位输入(如边界框、关键点或参…

【学习资源】MBSE和工业软件

工业软件从业者,需要学习与应用MBSE方法论,解决复杂问题的有效手段。笔者做一个简单介绍。 1 什么是MBSE? MBSE(Model-Based Systems Engineering,基于模型的系统工程)是一种系统工程方法论,其…

ue5 蒙太奇,即上半身动画和下半身组合在一起,并使用。学习b站库得科技

本文核心 正常跑步动画端枪动画跑起来也端枪 正常跑步动画 端枪动画的上半身 跑起来也端枪 三步走: 第一步制作动画蒙太奇和插槽 第二步动画蓝图选择使用上半身动画还是全身动画,将上半身端枪和下半身走路结合 第三步使用动画蒙太奇 1.开始把&a…

【Docker】docker compose 安装 Redis Stack

注:整理不易,请不要吝啬你的赞和收藏。 前文 Redis Stack 什么是? 简单来说,Redis Stack 是增强版的 Redis ,它在传统的 Redis 数据库基础上增加了一些高级功能和模块,以支持更多的使用场景和需求。Redis…