【OpenCV】OpenCV 4.9.0 正式发布

开源计算机视觉库 OpenCV 4.9.0 已于2023年12月29日正式发布。

此次发布有DNN模块对ONNX Attention、Einsum等层的支持、新的fastGEMM实现、transformers的实验性支持等诸多亮点。
在这里插入图片描述


OpenCV 4.9.0 更新内容:

(来自OpenCV中国团队以及中国社区的贡献以🍄标出)

DNN模块:

  • 实验性transformers支持 🍄

  • #24476 ONNX Attention层支持 🍄

  • #24037 ONNX Einsum层支持

  • #23987 OpenVINO后端对INT8模型的支持

  • #24092 ONNX Gather Elements层支持

  • #24378 ONNX InstanceNorm layer层支持 🍄

  • #24295 用cv::broadcast对ONNX Expand层重构 🍄

  • #24463 #24577 #24483 改进DNN图融合

  • #23897 #24694 #24509 新的fastGEMM实现 🍄

  • #23654 ARM上Winograd fp16的优化 🍄

  • Yolo系列模型支持的测试和bug修复 🍄

  • CUDA后端新的层的支持和bug修复: GEMM, Gelu, Add 🍄

  • #24462 CANN后端: bug修复, HardSwish, LayerNormalization和InstanceNormalization的支持 🍄

  • #24552 OpenVINO, OpenCL和CUDA后端LayerNormalization的支持 🍄

Core模块:

  • #23965 增加cv::broadcast 🍄

Objdetect模块:

  • #24364 修复QR码编码器版本估计的bug

  • #24355 使用动态窗口的更准确的ArUco标记角点细化

  • #24479 ArUco中过滤轮廓的bug修复

  • #24598 Android的QR码检测示例

  • ArUco标记, Charuco板及QR码的bug修复和文档更新

Video:

  • #24201 LIU Pengyu贡献了基于vision transformer的VitTrack模型的目标跟踪API TrackerVit 🍄

Calibration模块:

  • 棋盘格标定中的多个修复和改进

  • #23025 修复标定中stdDev的计算问题

  • #24482 修复findEssentialMat使用USAC时的bug

  • #24527 修复cv::cornerSubPix中超出图像的访问

  • #23607 Fixed ap3p中的崩溃

  • #24035 修复stereoRectify图像边界

  • #24211 修复essential_solver.cpp中的"use after free"问题

Python Bindings:

  • 对丢失的类型和手动封装的类型添加了类型存根生成

  • #24026 Numpy数组添加只读标志处理

  • #24028 修复了模块内的异常处理和绑定

  • #23958 改进了Numpy数组类型处理中的错误消息

  • #24468 修复了 Python 中的构造函数文档

Android:

  • 在Maven Central发布新的Android Archive Package (AAR)

  • 新的Android示例: QR码检测,视频IO;更新DNN和Face Detector示例

  • 改用Gradle 7.6.3

平台支持:

  • #23021 CMake中增加CUDA作为第一语言的支持,目前使用的是已经弃用的(自 CMake 3.10 起)FindCUDA 模块。

其他:

  • HAN Liutong实现OpenCV的CPU优化代码兼容可变向量长度的SIMD (RISC-V RVV) 🍄

OpenCV Model Zoo:

自OpenCV 4.9.0起,OpenCV Model Zoo (https://github.com/opencv/opencv_zoo) 将与opencv同步发布。

在这里插入图片描述


OpenCV 4.9 下载地址:

  • Documentation

  • Sources


![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/1157174922a44cf198beb7468cfed4da.png#pic_center)

OpenCV中国团队是OpenCV在中国的开发团队,非营利目的,致力于OpenCV的开发、维护和推广工作。


**本书京东优惠购书链接:https://item.jd.com/14098452.html**

在这里插入图片描述


1.1 图像的读取与保存

1.1.1 图像的读取

函数cv.imread用于从指定文件加载图像并返回该图像的矩阵。

函数原型
cv.imread(filename[, flags=IMREAD_COLOR]) → retval

参数说明

  • filename:读取图像的文件路径和文件名,包括文件扩展名。
  • flags:读取方式的参数,可选项如下。
    • IMREAD_COLOR:始终将图像转换为三通道BGR格式的彩色图像,是默认方式。
    • IMREAD_GRAYSCALE:始终将图像转换为单通道灰度图像。
    • IMREAD_UNCHANGED:按原样返回加载的图像(使用Alpha通道)。
    • IMREAD_ANYDEPTH:输入具有相应深度时会返回16位或32位图像,否则会转换为8位图像。
    • IMREAD_ANYCOLOR:以任何可能的颜色格式读取图像。
  • retval:返回值,读取的OpenCV图像为多维Numpy数组。

注意问题
(1) 在OpenCV中,最常用的图像数据结构是C++语言定义的Mat类。在Python语言中,Mat类的对象创建和操作是通过Numpy数组实现的。OpenCV对图像的任何操作,本质上都是对 Numpy数组的运算。
(2) OpenCV读取图像文件,返回值是二维或三维Numpy数组。当读取灰度图像时,返回值是形为(h,w)的二维数组;当读取彩色图像时,返回值是形为(h,w,ch)的三维数组。
(3) 如果无法读取图像(如文件不存在、权限不正确、格式不被支持或无效),并不会有报错提示,而会返回一个空矩阵。
(4) 该函数不支持带有中文或空格的文件路径和文件名,但也不会出现报错提示。当必须使用中文路径或文件名时,可以使用函数cv.imdecode 处理,具体参见【例程0103】。
(5) 在OpenCV中,使用的彩色图像为BGR格式的图像,读取图像文件后,图像文件可按B/G/R的顺序存储为多维数组。PIL、PyQt、Matplotlib 等库使用的是RGB格式的图像,图像文件按R/G/B的顺序存储。
(6) 该函数默认忽略图像的透明通道(Alpha通道),通过设置参数flags=IMAGE_
UNCHANGED可以读取透明通道。
(7) 对于彩色图像文件,该函数默认按彩色图像格式读取,也可以通过设置flags=0读取为灰度图像格式。将彩色图像格式读取为灰度图像格式,本质上是读取的彩色图像,并将彩色图像转换为灰度图像。
(8) 目前支持的文件及扩展名如下。
◎ Windows 位图:.bmp、.dib。
◎ JPEG 文件:.jpeg、.jpg、.jpe。
◎ JPEG 2000文件:.jp2。
◎ 便携式网络图形:.png。
◎ WebP:.webp。
◎ 便携式图像:.pbm、.pgm、.ppm、.pxm、.pnm。
◎ TIFF 文件:.tiff、.tif。


1.1.2 图像的保存

函数cv.imwrite可以基于扩展名的格式将图像保存到指定文件。
函数原型
cv.imwrite(filename, img[,params]) → retval

参数说明

  • filename:保存图像的文件路径和文件名,包括文件扩展名。
  • img:要保存的 OpenCV 图像,格式为多维Numpy数组。
  • params:编码格式参数,可选项如下。
    • IMWRITE_JPEG_QUALITY:设置JPEG/JPG格式图片的质量。数值越大,图片质量越高,取值范围为0~100,默认值为95。
    • IMWRITE_PNG_COMPRESSION:设置PNG 格式图片的压缩比。数值越大,压缩比越大,取值范围为0~9,默认值为3。
    • IMWRITE_TIFF_RESUNIT:设置TIF 格式图片的分辨率。
    • IMWRITE_WEBP_QUALITY:设置WEBP 格式图片的质量。数值越大,图片质量越高,取值范围为1~100,默认值为100。
    • IMWRITE_JPEG2000_COMPRESSION_X1000:设置JPEG2000格式图片的质量,默认值为1000。
  • retval:返回值,是布尔值,保存成功标志。

    注意问题
    (1) 图像通常保存为8位单通道图像或BGR三通道彩色图像,而BGRA四通道图像可以使用Alpha通道保存为PNG图像,更多设置详见OpenCV说明文档(链接1-1)。
    (2) 函数cv.imwrite将OpenCV图像(多维Numpy数组)保存为图像文件,图像的保存格式由filename的扩展名决定,与读取图像文件时的图像格式无关。
    (3) 函数cv.imwrite不支持带有中文或空格的文件路径和文件名,但也不会有报错提示。需要使用中文路径或文件名时,可以使用函数cv.imdecode 处理,参见【例程0103】。

【例程0101】用OpenCV读取和保存图像文件

本例程用OpenCV读取和保存图像文件,注意读取图像文件时的参数设置。

# 【0101】用OpenCV 读取和保存图像文件
import cv2 as cv

if __name__ == '__main__':
    # 读取图像文件,支持 BMP、JPG、PNG、TIFF 等常用格式
    filepath = "../images/Lena.tif"  # 读取图像文件的路径
    img = cv.imread(filepath, flags=1)  # flags=1 读取彩色图像文件(BGR)
    gray = cv.imread(filepath, flags=0)  # flags=0 读取为灰度图像

    saveFile = "../images/imgSave1.png"  # 保存图像文件的路径
    cv.imwrite(saveFile, img, [int(cv.IMWRITE_PNG_COMPRESSION), 8])
    cv.imwrite("../images/imgSave2.png", gray)

程序说明
(1) 本例程读取的图像文件是彩色图像文件。读取为彩色图像时可以设置flags=1,也可以省略;读取为灰度图像时必须设置flags=0。
(2) 读取和保存图像文件可以使用相对路径或绝对路径。
(3) 读取文件时要注意检查指定路径的图像文件是否存在。


【例程0102】从网络地址读取图像文件

本例程使用函数cv.imdecode从指定的内存缓存中读取数据,并将数据转换为图像格式,用于从网络传输数据中恢复图像。

# 【0102】从网络地址读取图像文件
import cv2 as cv
import numpy as np

if __name__ == '__main__':
    import urllib.request as request
    response = request.urlopen\
        ("https://profile.csdnimg.cn/8/E/F/0_youcans")  # 指定的 url 地址
    imgUrl = cv.imdecode(np.array(bytearray(response.read()), dtype=np.uint8), -1)

    cv.imshow("imgUrl", imgUrl)  # 在窗口显示图像
    key = cv.waitKey(5000)  # 5000 毫秒后自动关闭
    cv.destroyAllWindows()

程序说明
(1) 从网络地址读取图像文件不能使用函数cv.imread,而要使用函数cv.imdecode。
(2) 函数cv.imdecode能将图像编码为流数据,赋值到内存缓存中,以方便网络传输。


【例程0103】读取和保存文件路径中带有中文字符的图像

本例程用于读取/保存文件路径中带有中文字符的图像。

# 【0103】读取和保存文件路径中带有中文字符的图像
import cv2 as cv
import numpy as np

if __name__ == '__main__':
    filepath = "../images/测试图01.tif"  # 带有中文的文件路径和文件名
    # img1 = cv.imread(filepath, flags=1)  # 中文路径读取失败,但不会报错
    img2 = cv.imdecode(np.fromfile(filepath, dtype=np.uint8), flags=-1)

    saveFile = "../images/测试图02.tif"  # 带有中文的保存文件路径
    # cv.imwrite(saveFile, img2)  # 中文路径保存失败,但不会报错
    cv.imencode(".jpg", img2)[1].tofile(saveFile)

程序说明
如果读取/保存图像的路径和文件名中含有中文字符,则不能用函数cv.imread/cv.imwrite操作,可以使用函数cv.imdecode/cv.imencode处理。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/280664.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【Web】vulhub-httpd apache解析漏洞复现(1)

目录 ①CVE-2017-15715 ②apache_parsing_vulnerability ①CVE-2017-15715 贴出源码&#xff1a; <?php if(isset($_FILES[file])) {$name basename($_POST[name]);$ext pathinfo($name,PATHINFO_EXTENSION);if(in_array($ext, [php, php3, php4, php5, phtml, pht]))…

Linux:apache优化(4)—— 隐藏版本号

运行环境 yum -y install apr apr-devel cyrus-sasl-devel expat-devel libdb-devel openldap-devel apr-util-devel apr-util pcre-devel pcre gcc make zlib-devel 源码包配置 ./configure --prefix/usr/local/httpd --enable-cgi --enable-rewrite --enable-so --enabl…

cleanmymac这个软件怎么样?值不值得下载

cleanmymac是我必装的mac端清理软件&#xff0c;界面简洁好看&#xff0c;完美适配mac系统&#xff0c;文件清理的速度、精度都比较优秀&#xff0c;还是比较不错的呢。cleanmymac作为一款第三方清洁应用程序&#xff0c;具有专业完整的清理功能&#xff0c;包括释放内存、一键…

【办公技巧】怎么批量提取文件名到excel

Excel是大家经常用来制作表格的文件&#xff0c;比如输入文件名&#xff0c;如果有大量文件需要输入&#xff0c;用张贴复制或者手动输入的方式还是很费时间的&#xff0c;今天和大家分享如何批量提取文件名。 打开需要提取文件名的文件夹&#xff0c;选中所有文件&#xff0c…

HTML---JavaScript基础

文章目录 目录 文章目录 本章目标 一.JavaScript基础 概述 特点 JavaScript 基本机构 语法 网页中引用JavaScript的方式 二. JavaScript核心语法 变量 ​编辑 数据类型 数组 练习 本章目标 掌握JavaScript的组成掌握JavaScript的基本语法会定义和使用函数会使用工具进行…

[Angular] 笔记 22:ElementRef

chatgpt: ElementRef 是 Angular 中的一个类&#xff0c;它用于包装对 DOM 元素的引用。它允许开发者直接访问与 Angular 组件关联的宿主 DOM 元素。 当在 Angular 中需要直接操作 DOM 元素时&#xff0c;可以使用 ElementRef。通常情况下&#xff0c;最好避免直接操作 DOM&a…

【Transformer】深入理解Transformer模型1——初步认识了解

前言 Transformer模型出自论文&#xff1a;《Attention is All You Need》 2017年 近年来&#xff0c;在自然语言处理领域和图像处理领域&#xff0c;Transformer模型都受到了极为广泛的关注&#xff0c;很多模型中都用到了Transformer或者是Transformer模型的变体&#xff0…

OSPF的DR与BDR-新版(16)

目录 整体拓扑 操作步骤 1.基本配置 1.1 配置R1的IP 1.2 配置R2的IP 1.3 配置R3的IP 1.4 配置R4的IP 1.5 检测R1与R4连通性 1.6 检测R1与R2连通性 1.7 检测R1与R3连通性 2.搭建基本的OSPF网络 2.1 配置R1 OSPF 2.2 配置R2 OSPF 2.3 配置R3 OSPF 2.4 配置R4 OSPF…

前端八股文(工程化篇)

目录 1.常用的git命令有哪些&#xff1f; 2.git rebase和git merge的区别 3.有哪些常见的Loader和Plugin&#xff1f; 4.webpack的构建流程 5.bundle,chunk,module是什么&#xff1f; 6.如何提高webpack的打包速度 7.vite比webpack快在哪里 8.说一下你对Monorepo的理解 …

C语言函数篇——strcat()函数

strcat()函数介绍&#xff1a; strcat()函数是C语言中用于连接两个字符串的函数。它将第二个字符串连接到第一个字符串的末尾&#xff0c;并返回第一个字符串的地址。 strcat()函数的语法&#xff1a; char *strcat(char *dest, const char *src); 其中&#xff0c;dest是目标…

数字图像处理——亚像素边缘的轮廓提取

像素 像素是图像处理中的基本单位&#xff0c;一个像素是图像中最小的离散化单位&#xff0c;具有特定的位置和颜色信息。在数字图像中&#xff0c;每个像素都有一个特定的坐标&#xff0c;通常以行和列的形式表示。每个像素的颜色信息可以通过不同的表示方式&#xff0c;如灰…

大数据- Hadoop入门

目录 &#x1f436;2.1 hadoop的简介 1. 概述 2. 什么是分布式&#xff1f; 3. Hadoop的指代 &#x1f436;2.2 hadoop的发展历程 &#x1f436;2.3 hadoop的版本介绍 &#x1f436;2.4 hadoop的常用端口号 &#x1f436;2.5 hadoop的设计目的 &#x1f436;2.6 hadoo…

使用vmware,在ubuntu18.04中使用笔记本的摄像头

步骤1&#xff1a;在windows中检查相机状态 win10系统中&#xff0c;在左下的搜索栏&#xff0c;搜索“相机”&#xff0c;点击进入即可打开相机&#xff0c;并正常显示图像。 注意&#xff1a;如果相机连接到了虚拟机&#xff0c;则不能显示正常。 步骤2&#xff1a;在ubuntu…

轻松调整视频时长,创意与技术的新篇章

传统的视频剪辑工具往往难以精确控制时间&#xff0c;而【媒体梦工厂】凭借其先进的算法和界面设计&#xff0c;让视频时长的调整变得简单而精确&#xff0c;助你释放无限的创意&#xff0c;用技术为你的创意插上翅膀&#xff0c;让每一秒都有意义。 所需工具&#xff1a; 一…

【Matlab】BP 神经网络时序预测算法

资源下载&#xff1a; https://download.csdn.net/download/vvoennvv/88681507 一&#xff0c;概述 BP 神经网络是一种常见的人工神经网络&#xff0c;也是一种有监督学习的神经网络。其全称为“Back Propagation”&#xff0c;即反向传播算法。BP 神经网络主要由输入层、隐藏层…

1、aigc图像相关

aigc图像相关 一、Diffusion webui 在autodl上部署一些问题二、lora和kohyass&#xff08;1&#xff09;角色模型&#xff08;2&#xff09;风格模型&#xff08;3&#xff09;dreambooth&#xff08;4&#xff09;模型合并&#xff08;5&#xff09;Lora加Adetail其他 三、sd …

数模混合SoC芯片中LEF2Milkyway的golden flow

在数模混合芯片中的项目中&#xff0c;特别是数字模块很少甚至只有一个简单的数字控制逻辑时&#xff0c;我们要做数字模块的后端实现时&#xff0c;通常模拟那边会问我们实现需要他们提供哪些数据。 通常来说&#xff0c;我们可以让模拟设计提供数字模块的GDS或LEF文件即可。…

【LeetCode每日一题】1185.一周中的第几天(模拟+调用库函数:三种方法)

2023-12-30 文章目录 一周中的第几天方法一&#xff1a;模拟思路步骤 方法二&#xff1a;调用库函数方法三&#xff1a;调用库函数 一周中的第几天 ​ 提示&#xff1a;给出的日期一定是在 1971 到 2100 年之间的有效日期。 方法一&#xff1a;模拟 思路 1.可以根据1970年的…

WPF+Halcon 培训项目实战(11):HS组件封装

文章目录 前言相关链接项目专栏运行环境匹配图片封装组件新增类库项目选择依赖顺序并添加Nuget修改原本矩形方法运行结果&#xff1a; 对矩形进行抽象封装抽象基类矩形抽象改造 圆形抽象封装代码运行结果 前言 为了更好地去学习WPFHalcon&#xff0c;我决定去报个班学一下。原…

2023 搞懂git 工作目录---暂存区---本地仓库---版本库

最近了解了下git的底层原理&#xff08;大神录制的视频放在最下方&#xff09;&#xff0c;记录下&#xff1a; 工作区 就是存放待提交文件的目录&#xff08;下图图解标注&#xff09;比如pyhon_test目录暂存区 .git目录下的index文件 对应的指令 git add本地仓库 .gi…