Python使用Numba装饰器进行加速

Python使用Numba装饰器进行加速

  • 前言
  • 前提条件
  • 相关介绍
  • 实验环境
  • Numba装饰器进行加速
    • 未加速的代码
      • 输出结果
    • @numba.jit加速的代码
      • 输出结果

在这里插入图片描述

前言

  • 由于本人水平有限,难免出现错漏,敬请批评改正。
  • 更多精彩内容,可点击进入Python日常小操作专栏、OpenCV-Python小应用专栏、YOLO系列专栏、自然语言处理专栏或我的个人主页查看
  • 基于DETR的人脸伪装检测
  • YOLOv7训练自己的数据集(口罩检测)
  • YOLOv8训练自己的数据集(足球检测)
  • YOLOv5:TensorRT加速YOLOv5模型推理
  • YOLOv5:IoU、GIoU、DIoU、CIoU、EIoU
  • 玩转Jetson Nano(五):TensorRT加速YOLOv5目标检测
  • YOLOv5:添加SE、CBAM、CoordAtt、ECA注意力机制
  • YOLOv5:yolov5s.yaml配置文件解读、增加小目标检测层
  • Python将COCO格式实例分割数据集转换为YOLO格式实例分割数据集
  • YOLOv5:使用7.0版本训练自己的实例分割模型(车辆、行人、路标、车道线等实例分割)
  • 使用Kaggle GPU资源免费体验Stable Diffusion开源项目

前提条件

  • 熟悉Python

相关介绍

  • Python是一种跨平台的计算机程序设计语言。是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越多被用于独立的、大型项目的开发。
  • Python是一种非常流行和强大的编程语言,它有很多优点,比如简洁、易读、灵活、跨平台、丰富的库等。但是,Python也有一些缺点,其中之一就是运行速度相对较慢。
  • Python为什么慢呢?这主要有以下几个原因:
    • Python是一种解释型语言,也就是说,它的代码在运行时才被解释器转换成机器语言,而不是像编译型语言那样,提前编译成可执行文件。这样就增加了运行时的开销,降低了执行效率。
    • Python使用了动态类型,也就是说,它的变量在运行时才确定类型,而不是像静态类型那样,提前声明类型。这样就增加了运行时的类型检查和转换,降低了执行效率。
    • Python使用了全局解释器锁(GIL),也就是说,它的多线程在同一时刻只能有一个线程执行,而不是像多核处理器那样,可以并行执行多个线程。这样就限制了Python的并发能力,降低了执行效率。
  • Python的运行速度可以通过一些方法进行优化和加速,比如:
    • 使用PyPy,这是一种基于JIT(即时编译)技术的Python解释器,它可以在运行时动态编译Python代码,提高执行效率。
    • 使用Numba,这是一种基于LLVM(低级虚拟机)技术的Python库,它可以将Python函数编译成机器码,提高执行效率。
    • 使用Cython,这是一种基于C语言的Python扩展,它可以将Python代码转换成C代码,提高执行效率。
    • 使用多进程,这是一种利用多核处理器的并行计算方法,它可以创建多个进程,避免GIL的限制,提高执行效率。
  • Numba是一个用于Python的开源即时编译器,它可以将Python代码编译为机器代码,从而提高Python代码的执行速度。
  • Numba的优缺点:
    • 优点:
      • Numba可以显著提高Python代码的执行速度,特别是在处理大量数据时。
      • Numba使用LLVM(低级虚拟机)技术将Python函数编译成机器码,从而避免了Python解释器的性能瓶颈。
      • Numba可以通过使用JIT(Just-In-Time)编译技术,将Python代码转换为机器代码,即当你调用Python函数时,你的全部或部分代码就会被转换为“即时”执行的机器码,它将以你的本地机器码速度运行,从而避免了Python解释器的性能瓶颈。
      • Numba支持多种CPU架构和操作系统,包括x86、ARM和PowerPC。
      • Numba可以与NumPy和SciPy等科学计算库无缝集成。
    • 缺点:
      • Numba只能加速一部分Python代码,例如数值计算密集型代码,而对于I/O密集型代码,Numba的加速效果不明显。
      • Numba需要对代码进行修改,以便使用其加速功能,这可能需要一些额外的工作。
      • Numba的性能取决于代码的质量和结构,因此需要一定的编程经验和技能。
  • 以下是一个简单的numba加速例子,它比较了使用numba和不使用numba的情况下,计算斐波那契数列的第n项的时间消耗。
import time
import numba

import warnings
warnings.filterwarnings('ignore')

# 不使用numba的函数
def fib(n):
    if n < 2:
        return n
    return fib(n-1) + fib(n-2)

# 使用numba的函数
@numba.jit
def fib_numba(n):
    if n < 2:
        return n
    return fib_numba(n-1) + fib_numba(n-2)

# 测试两个函数的运行时间
n = 40
start = time.time()
fib(n)
end = time.time()
print(f'不使用numba的时间:{end - start}秒')

start = time.time()
fib_numba(n)
end = time.time()
print(f'使用numba的时间:{end - start}秒')
不使用numba的时间:15.397910833358765秒
使用numba的时间:0.731497049331665秒

实验环境

  • Python 3.x (面向对象的高级语言)
  • Numba 0.58.1(Python第三方库)pip install numba -i https://pypi.tuna.tsinghua.edu.cn/simple
    在这里插入图片描述

Numba装饰器进行加速

未加速的代码

import time

def one_cycle():
    num = 0  
    for i in range(1, 1000000):  
        num +=i
    return num

def double_cycle():
    num = 0 
    for i in range(1000):  
        for j in range(1000):
            num +=i*j
    return num  
              
def triple_cycle():
    num = 0
    for i in range(100):  
        for j in range(100):  
            for k in range(100):
                num += i*j*k
    return num        

if __name__=="__main__":
    start_time = time.time()
    for i in range(100):
        one_cycle()
    end_time = time.time()
    print("one_cycle函数运行时间:",(end_time-start_time)/100)

    start_time = time.time()
    for i in range(100):
        double_cycle()
    end_time = time.time()
    print("double_cycle函数运行时间:",(end_time-start_time)/100)

    start_time = time.time()
    for i in range(100):
        triple_cycle()
    end_time = time.time()
    print("triple_cycle函数运行时间:",(end_time-start_time)/100)

输出结果

one_cycle函数运行时间: 0.021781625747680663
double_cycle函数运行时间: 0.031956143379211426
triple_cycle函数运行时间: 0.042625854015350344

@numba.jit加速的代码

import time
import numba

import warnings
warnings.filterwarnings('ignore')

@numba.jit
def one_cycle():
    num = 0  
    for i in range(1, 1000000):  
        num +=i
    return num

@numba.jit
def double_cycle():
    num = 0 
    for i in range(1000):  
        for j in range(1000):
            num +=i*j
    return num  
              
@numba.jit
def triple_cycle():
    num = 0
    for i in range(100):  
        for j in range(100):  
            for k in range(100):
                num += i*j*k
    return num        

if __name__=="__main__":
    start_time = time.time()
    for i in range(100):
        one_cycle()
    end_time = time.time()
    print("one_cycle函数运行时间:",(end_time-start_time)/100)

    start_time = time.time()
    for i in range(100):
        double_cycle()
    end_time = time.time()
    print("double_cycle函数运行时间:",(end_time-start_time)/100)

    start_time = time.time()
    for i in range(100):
        triple_cycle()
    end_time = time.time()
    print("triple_cycle函数运行时间:",(end_time-start_time)/100)

输出结果

one_cycle函数运行时间: 0.002056455612182617
double_cycle函数运行时间: 0.00046929597854614255
triple_cycle函数运行时间: 0.0007887816429138183
  • 由于本人水平有限,难免出现错漏,敬请批评改正。
  • 更多精彩内容,可点击进入Python日常小操作专栏、OpenCV-Python小应用专栏、YOLO系列专栏、自然语言处理专栏或我的个人主页查看
  • 基于DETR的人脸伪装检测
  • YOLOv7训练自己的数据集(口罩检测)
  • YOLOv8训练自己的数据集(足球检测)
  • YOLOv5:TensorRT加速YOLOv5模型推理
  • YOLOv5:IoU、GIoU、DIoU、CIoU、EIoU
  • 玩转Jetson Nano(五):TensorRT加速YOLOv5目标检测
  • YOLOv5:添加SE、CBAM、CoordAtt、ECA注意力机制
  • YOLOv5:yolov5s.yaml配置文件解读、增加小目标检测层
  • Python将COCO格式实例分割数据集转换为YOLO格式实例分割数据集
  • YOLOv5:使用7.0版本训练自己的实例分割模型(车辆、行人、路标、车道线等实例分割)
  • 使用Kaggle GPU资源免费体验Stable Diffusion开源项目

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/129324.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Aspose.OCR for .NET 2023Crack

Aspose.OCR for .NET 2023Crack 为.NET在图片上播放OCR使所有用户和程序员都可以从特定的图像片段中提取文本和相关的细节&#xff0c;如字体、设计以及书写位置。这一特定属性为OCR的性能及其在扫描遵循排列的记录时的功能提供了动力。OCR的库使用一条线甚至几条线来处理这些特…

什么是证书管理

在自带设备和物联网文化的推动下&#xff0c;数字化使连接到互联网的设备数量空前加速。在企业网络环境中&#xff0c;每个在线运行的设备都需要一个数字证书来证明其合法性和安全运行。这些数字证书&#xff08;通常称为 X.509 证书&#xff09;要么来自称为证书颁发机构 &…

长虹智能电视使用123

1、开机 在接通电源的情况下&#xff0c;长虹智能电视开机有两种方式。 方式1&#xff1a; 按电视右下角开机按钮 方式2&#xff1a; 按电视遥控器开机按钮 长虹智能电视开机后会进入其操作系统&#xff08;安卓&#xff09;。 屏幕左右双箭头图表&#xff0c;手指点击会…

力扣876:链表的中间结点

力扣876&#xff1a;链表的中间结点 题目描述&#xff1a; 给你单链表的头结点 head &#xff0c;请你找出并返回链表的中间结点。 如果有两个中间结点&#xff0c;则返回第二个中间结点。 示例 1&#xff1a; 输入&#xff1a;head [1,2,3,4,5] 输出&#xff1a;[3,4,5]…

无线优化之RRM模板

一、简介 RRM即,Radio Resource Management,射频资源管理 WLAN技术是以射频信号(如2.4G/5G的无线电磁波)作为传输介质,无线电磁波在传输过程中因周围环境导致无线信号衰减,从而影响无线用户上网的服务质量。 RRM模板主要用于保持最优的频射资源状态,自动检查周围无线…

二十四、城市建成区提取结果制图——建成区出图

一、前言 其实制图这一系列文章主要是为了照顾初学者,因为很多初学者并不是特别熟悉GIS平台一些操作,可能对于初步的制图有一定了解,但是对于一些稍微看起来高级并且复杂一点的图如何制作?例如下面这种多景的制作,其实吧万变不离其宗,这种仅仅只是拼接多幅数据框在一起,…

关于css 推荐几个超好看渐变色!

1.多彩糖果渐变 background: linear-gradient(135deg, #ff00cc, #ffcc00, #00ffcc, #ff0066);这个渐变色使用了多个鲜艳的颜色&#xff0c;从紫红色 (#ff00cc) 渐变到橙色 (#ffcc00)&#xff0c;然后到青色 (#00ffcc)&#xff0c;最后到鲜艳的粉红色 (#ff0066)。它给人一种快乐…

为啥$p(w|D)=p(y|X,w)$?

为啥 p ( w ∣ D ) p ( y ∣ X , w ) p(w|D)p(y|X,w) p(w∣D)p(y∣X,w)&#xff1f; p ( w ∣ X , y ) p ( w ∣ D ) p(w|X,y)p(w|D) p(w∣X,y)p(w∣D), p ( w ∣ D ) p ( D , w ) / p ( D ) p(w|D)p(D,w)/p(D) p(w∣D)p(D,w)/p(D)为啥 p ( D ∣ w ) p ( y ∣ X , w ) p(D|…

kubernetes istio

目录 一、部署 二、部署示例应用 三、部署遥测组件 四、流量管理 五、熔断 官网&#xff1a;https://istio.io/latest/zh/about/service-mesh/ 一、部署 提前准备好文件 tar zxf 15t10-1.19.3-linux-amd64.tar.gz cd 15t10-1.19.3/ export PATH$PWD/bin:$PATHistioctl install …

强化学习 - DQN及进化过程(Double DQN,Dueling DQN)

1.DQN 1.1概念 DQN相对于Q-Learning进行了三处改进&#xff1a; 1.引入神经网络&#xff1a;如下图所示希望能从状态S中提取Q(s,a) 2.经验回放机制&#xff1a;连续动作空间采样时&#xff0c;前后数据具有强关联性&#xff0c;而神经网络训练时要求数据之间具有独立同分布特性…

数据结构:AVL树的旋转(高度平衡树)

1、AVL树简介 AVL树是最先发明的自平衡二叉查找树。在AVL树中任何节点的两个子树的高度最大差别为1&#xff0c;所以它也被称为高度平衡树。增加和删除可能需要通过一次或多次树旋转来重新平衡这个树。AVL树得名于它的发明者G. M. Adelson-Velsky和E. M. Landis&#xff0c;他们…

CSS3渐变颜色

CSS3 渐变可以让你在两个或多个指定的颜色之间显示平稳的过渡。 CSS3渐变有两种类型&#xff1a;线性渐变&#xff08;Linear Gradients&#xff09;和径向渐变&#xff08;Radial Gradients&#xff09;。 线性渐变&#xff08;Linear Gradients&#xff09;&#xff1a; 线性…

MSVCP140_CODECVT_IDS.dll丢失怎么办?推荐三个解决方法帮你解决

MSVCP140_CODECVT_IDS.dll是Microsoft Visual C 2015 Redistributable的一个组件&#xff0c;它包含了一些运行时库文件。当您在运行某些程序时&#xff0c;可能会遇到“msvcp140_codecvt_ids.dll丢失”的错误提示。为了解决这个问题&#xff0c;您可以尝试以下三种方法&#x…

CH11_重构API

将查询函数和修改函数分离&#xff08;Separate Query from Modifier&#xff09; function getTotalOutstandingAndSendBill() {const result customer.invoices.reduce((total, each) > each.amount total, 0);sendBill();return result; }function totalOutstanding() …

Adobe ME下载、Media Encoder下载

Media Encoder 2021 是一款可以帮助Adobepremiere pro和Adobe After Effects的用户使用集成视频编码器进行创作的视频和音频编码软件。Media Encoder 2021 mac新版本中针对上一个版本进行了多方面的改进与优化&#xff0c;提升了软件的性能与支持文件格式提升&#xff0c;有需要…

CSS3图片反射box-reflect属性

CSS3中有一个box-reflect属性&#xff0c;也就是图片反射&#xff0c;主要的效果是将一张图片反射到对应面并且可以设置想要的一些效果&#xff08;如&#xff1a;渐变&#xff09;等 语法 box-reflect&#xff1a;包括三个值 direction 定义方向 above 反射到对象的上面below…

MySQL | 查询接口性能调优、编码方式不一致导致索引失效

背景 最近业务反馈&#xff0c;列表查询速度过慢&#xff0c;需要优化。 到正式环境系统去验证&#xff0c;发现没筛选任何条件的情况下&#xff0c;查询需要三十多秒&#xff0c;而筛选了条件之后需要13秒。急需优化。 先说结论&#xff1a;连表用的字段编码方式不一致导致索…

基于SSM的水果网上商城设计与实现

末尾获取源码 开发语言&#xff1a;Java Java开发工具&#xff1a;JDK1.8 后端框架&#xff1a;SSM 前端&#xff1a;Vue 数据库&#xff1a;MySQL5.7和Navicat管理工具结合 服务器&#xff1a;Tomcat8.5 开发软件&#xff1a;IDEA / Eclipse 是否Maven项目&#xff1a;是 目录…

Netty入门指南之NIO 网络编程

作者简介&#xff1a;☕️大家好&#xff0c;我是Aomsir&#xff0c;一个爱折腾的开发者&#xff01; 个人主页&#xff1a;Aomsir_Spring5应用专栏,Netty应用专栏,RPC应用专栏-CSDN博客 当前专栏&#xff1a;Netty应用专栏_Aomsir的博客-CSDN博客 文章目录 参考文献前言基础扫…

Netty入门指南之NIO Buffer详解

作者简介&#xff1a;☕️大家好&#xff0c;我是Aomsir&#xff0c;一个爱折腾的开发者&#xff01; 个人主页&#xff1a;Aomsir_Spring5应用专栏,Netty应用专栏,RPC应用专栏-CSDN博客 当前专栏&#xff1a;Netty应用专栏_Aomsir的博客-CSDN博客 文章目录 参考文献前言ByteBu…