FPGA 通过 UDP 以太网传输 JPEG 压缩图片

FPGA 通过 UDP 以太网传输 JPEG 压缩图片

08ade5d13c9d6321413ce8eca6953ec6.jpeg

简介

在 FPGA 上实现了 JPEG 压缩和 UDP 以太网传输。从摄像机的输入中获取单个灰度帧,使用 JPEG 标准对其进行压缩,然后通过UDP以太网将其传输到另一个设备(例如计算机),所有这些使用FPGA(Verilog)实现。

本文是常春藤盟校Cornell University 康奈尔大学的FPGA项目,仅供参考学习~

理论背景

JPEG 图像压缩是一种有损压缩标准,它使用 DCT 变换及其相关属性来减少用于表示图像的位数。编码过程涉及许多步骤,在我们的设计中将其分解为几个独立模块。此外,为了验证压缩的正确性,还为系统设计了UDP以太网传输。

离散余弦变换

离散余弦变换 (Discrete Cosine Transform, DCT)类似于傅里叶变换将周期函数表示为不同频率的正弦之和,其可以将有限长度的数字序列表示为不同频率的余弦项的总和。DCT,更具体地说是DCT-II,由于其高能量压缩特性而被用于图像压缩。简而言之,大部分数据(或原始信息)可以被压缩为更少的比特数。

JPEG 压缩的第一步是将相关图像分割成 8x8 的像素块。然后将 2D-DCT 应用于每个 8x8 块。2-D DCT 的结果表示原始块在与矩阵索引相对应的离散频率处的空间频率信息。变换后,左上系数给出空间DC信息,右下系数给出最高空间频率(水平和垂直方向)信息。空间频率表示如下图所示。

d7b66a8e58aadf2bedc5bfee1602d1e2.png

注意,左上元素在水平和垂直方向上的空间频率较低,而右下元素的频率较高。使用 DCT,大多数原始信息可以从较低频率系数(靠近左上角的系数)重建,因为这些系数中的高能量压缩。此外,人类视觉系统对高频空间内容中的错误的感知能力较差。这两个原因叠加在一起意味着低频系数中的误差比高频元素中的误差对人类来说更加明显。

2-D DCT 运算是可分离的,意味着它可以通过对正在分析的块(8x8)应用两次 1-D DCT 来获得。首先对块的每一行执行一维变换,然后对行变换结果的列再执行一维变换。一维 DCT 系数可以使用以下等式获得:

e143a2188a2fb2d281195f7975e85656.png

其中 k 是系数的索引。对于 JPEG 变换的情况,因为变换应用于图像的 8x8 像素块,所以 N 始终等于 8。

量化

DCT 应用于 8x8 块时,量化因子会应用于系数。简而言之,此步骤使用与能量密度相关的步长对系数进行离散化。低频系数以较小的步长量化,因此比以较大步长量化的误差更小。频率越高,步长越大,从而降低了不太重要元素的精度。这是压缩过程中的有损步骤。

3c53d33a0e0e880a75749ab819e81e30.png

尽管 JPEG 压缩标准没有指定要使用的量化矩阵,但上面建议的矩阵之一。为了量化 2-D DCT 的结果,每个系数除以上面矩阵中的适当值,并四舍五入到最接近的整数。

Zig-Zag 测序

量化后,二维矩阵被重新排列成一维数组。以给出具有高能量密度的系数的方式读取元素。排序以之字形方法完成,使得系数以递增的空间频率顺序排列。使用这种方法,更重要的系数出现在序列中较早的位置,而不太重要的系数则出现在较晚的位置。

6f0f37d43a953f5791d68b51d1943314.png

可变大小、行程长度编码

假设高频系数使用较大的步长进行量化,这些系数为零的可能性比低频系数高得多。这对零值系数的候选进行了分组,使我们能够假设一系列零的可能性。

JPEG 标准压缩的主要来源是可变大小和行程长度编码。压缩中的此步骤使用霍夫曼编码和可变长度编码的组合。每个非零系数都被转换为可变长度的位串或代码。该代码包含其数量和长度信息(即 0 与 00 不同)。

如前所述,之字形组织增加了连续零的可能性,尤其是在数组末尾附近。为了避免发送连续的零,前面的零的行程长度被编码到每个非零系数的转换中。每个非零系数都被编码为可变长度代码,以及指示前面的零游程的“标头”霍夫曼代码以及 VL 代码的长度。链接(https://people.ece.cornell.edu/land/courses/ece5760/FinalProjects/f2009/jl589_jbw48/jl589_jbw48/trans_tables.html)显示了像素转换表和霍夫曼表 。这些转换表仅适用于图像的亮度值。由于我们的系统处理灰度图像,所以无需改变方案,但是对于彩色图像使用的色度值有不同的转换方案。

无论长度如何,霍夫曼码都是唯一可识别的,因此在不知道长度的情况下始终可以识别新非零值的零行程和大小。然后,使用霍夫曼给出的大小,可以提取以下 VL 位并将其转换回适当的非零系数。除非事先知道代码的长度,否则 VL 代码无法唯一识别。

DC与AC系数

DC 系数的编码与 AC 系数略有不同。由于 DC 系数不会有前面的零(这些零不会在块之间传递),因此霍夫曼码仅反映 VL 码的长度。

以太网

在开放系统互连参考模型(Open System Interconnection Reference Model,OSI 模型)中,以太网位于链路层和物理层。在物理层,以太网描述了线路如何互连。在链路层,以太网指定以太网帧应如何格式化以及帧应如何传送。

由于以太网本质上是一种广播协议,可能有许多设备连接到同一物理线路,因此一次只能有一个设备进行广播。如果线路发生冲突,以太网控制器能够检测到冲突并执行随机退避。随机退避仅仅意味着在检测到冲突时,在尝试另一次发送之前等待随机的时间。以太网帧由前导码、帧起始定界符、MAC 目标、MAC 源、以太网类型、有效负载和校验和组成。

关于以太网的介绍可以查看《基于FPGA的网口通信实例设计总结》。

用户数据报协议/互联网协议

用户数据报协议 (UDP) 和互联网协议 (IP) 分别位于 OSI 模型的接下来两层:传输层和网络层。UDP/IP 协议与以太网一样,不保证可靠的数据包接收,只能保证尽力传送。IP 协议的主要目的是在链路层之上提供一个抽象层。这样,如果底层链路层不是以太网,则不需要更改应用层软件。IP 协议通过另一对源地址和目标地址、分段偏移、标头校验和以及有效负载中使用的协议来提供此抽象。

设计

代码高度模块化,输出馈送到successive模块的输入中。编码步骤分为以下步骤(每个步骤都在单独的模块中实现):1-D DCT、2-D DCT/量化、zig-zag 组织、VL 转换、Huffman 转换和比特流构建。该系统目前可以实现 256x256 图像,但可以扩展分析更多像素。数据架构图如下所示:

6c61887ccd8a349d3d213c1ba414c6fe.png

因为仅涉及灰度成像,所以只需要彩色系统所需的三分之一的内存和处理能力。对于处理彩色图像的系统,需要将上述整个压缩过程单独应用于每个颜色通道。该项目通过选择每个像素的绿色值来获得灰度图像,而不是从 RGB 到 YUV 的转换。这种简化虽然并不完全正确,但该项目的重点不是图像,而是压缩,因此没有必要在转换操作上浪费额外的计算。

1-D DCT

1-D DCT 使用快速算法实现,需要八个周期才能完成。该算法主要需要输入和结果总和的连续相加,其中三个中间步骤期间发生五次乘法。该算法产生 DCT 结果,结果是根据实际 DCT 结果按某个因子缩放的。然而,可以在量化步骤中考虑比例,从而产生正确的量化变换矩阵。系数的比例因子如下:

21316886653d6bb29ed814e498d366ef.png

算法数据流如下图所示。

fbc714102a5e6cc0ff420ef62c8b68d6.png 2fa38da4a505c686ad7ae09cc4a20153.png

该模块是按照流水线设计,所以每个时钟周期都可以输入新的输入值,并在八个周期后输出新的输出。这使得模块能够更快地进行数据处理。

2-D DCT

2-D DCT 是可分离运算,意味着它可以通过对 8x8 块的每一行应用 1-D DCT,然后再将其应用于 8x8 块的列来获得最终结果。使我们能够使用流水线 1-D DCT 非常快速地执行 2-D DCT,方法是将块的行馈送到 1-D 模块中 8 个周期,然后获取结果并将这些列反馈回同一模块。

在将结果写回内存之前,也会在此 2D 模块中执行量化。由于算法的缩放与量化相结合的方式,整个操作仅需要对二维算法结果进行移位。

Zig-Zag

通过适当的顺序从内存中读取值来实现Zig-Zag。块的元素存储在直接从图像内像素坐标获得的地址中。存储器的输出以每周期一个像素的速率直接馈送到转换器中。

VL 和 RL

从像素的量化值到可变长度代码的转换是使用查找表完成的。该表包含代码的值和长度(以bit为单位)。然后这两个值被发送到霍夫曼翻译器。霍夫曼转换器采用前面的零数量和系数代码的大小。这两个数字被馈送到另一个查找表,该查找表给出霍夫曼代码作为非零系数的“标头”。

硬件以太网控制器

硬件以太网控制器用于初始化 DM9000A 控制芯片、向 DM9000A 推送数据包、从 DM9000A 抓取接收到的数据以及从 DM9000A 接收中断。

控制器分为两个独立的状态机,一个处理发往 DM9000A 和来自 DM9000A 的命令(包括中断),另一个处理发送和接收序列。

发送序列包括:

  1. 等待输入 FIFO 不为空。将第一个值存储为有效负载中的字节数。

  1. 告诉硬件控制器将存储多少字节,包括以太网标头。

  1. 将以太网帧作为数据发送到DM9000A。

  1. 将负载发送到DM9000A。

  1. 通过中断等待传输完成。返回空闲状态。

UDP

使用FIFO数据结构,UDP Wrapper 首先获取有效负载中的字节总数,然后一次获取 16 位的有效负载。Wrapper 使用状态机执行以下步骤来发送单个 UDP 数据包:

  1. 等待输入 FIFO 不为空。将第一个值存储为有效负载中的字节数。

  1. 告诉硬件控制器将存储多少字节,包括 UDP/IP 标头。

  1. 将以太网帧作为数据发送到硬件控制器。

  1. 将IP 标头作为数据发送到硬件控制器。IP 校验和是在发送标头之前计算的。

  1. 将UDP 标头作为数据发送到硬件控制器。

  1. 将所有数据发送到硬件控制器。

由于 UDP Wrapper 的目的是让 FPGA 能够与通过以太网直接连接的单台计算机进行通信,因此许多值都被硬编码到 Verilog 中。硬编码值包括目标和源 MAC 地址、目标和源 IP 地址以及目标端口。这四个硬编码值均设置为广播地址,MAC 地址为 FF:FF:FF:FF:FF:FF,IP 地址为 255.255.255.255。目标端口被硬编码为 31373。其他值(例如 IP 标头校验和)是动态计算的,因为标头值不一定每次都相同。完成后,控制寄存器复位并返回等待状态。

结论

尽管我们无法让最终所需的系统运行,但我们确实创建了可以与各种其他应用程序相关的可用功能模块。UDP 包装器和硬件以太网控制器在任何网络通信项目中都非常有用。流水线式一维 DCT 算法可用于信号和图像处理项目。

附录

代码

https://people.ece.cornell.edu/land/courses/ece5760/FinalProjects/f2009/jl589_jbw48/jl589_jbw48/dct_to_ethernet.v

https://people.ece.cornell.edu/land/courses/ece5760/FinalProjects/f2009/jl589_jbw48/jl589_jbw48/zz_to_ethernet.v

1-D DCT 算法

https://people.ece.cornell.edu/land/courses/ece5760/FinalProjects/f2009/jl589_jbw48/jl589_jbw48/dct_algorithm.v

2-D DCT

https://people.ece.cornell.edu/land/courses/ece5760/FinalProjects/f2009/jl589_jbw48/jl589_jbw48/dct2d.v

Zig-Zag 控制

https://people.ece.cornell.edu/land/courses/ece5760/FinalProjects/f2009/jl589_jbw48/jl589_jbw48/zigzag.v

可变长度代码转换器

https://people.ece.cornell.edu/land/courses/ece5760/FinalProjects/f2009/jl589_jbw48/jl589_jbw48/translate_to_vl.v

霍夫曼转换器

https://people.ece.cornell.edu/land/courses/ece5760/FinalProjects/f2009/jl589_jbw48/jl589_jbw48/translate_to_huffman.v

比特流缓冲区

https://people.ece.cornell.edu/land/courses/ece5760/FinalProjects/f2009/jl589_jbw48/jl589_jbw48/bitstream_buffer.v

UDP 包装器

https://people.ece.cornell.edu/land/courses/ece5760/FinalProjects/f2009/jl589_jbw48/jl589_jbw48/udp_wrapper.zip

参考

https://people.ece.cornell.edu/land/courses/ece5760/FinalProjects/f2009/jl589_jbw48/jl589_jbw48/index.html

http://www.cs.cmu.edu/~dongw/final_fantasy/545FinalReport.html

http://en.wikipedia.org/wiki/Jpeg

http://www.impulseadventure.com/photo/jpeg-snoop.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/353171.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

excel统计分析——卡方检验(基本原理)

参考资料:生物统计学 卡方检验(chi-square test)又称检验,是英国数理统计学家Karl Pearson推导出来的,该方法是处理分类变量或离散型数据的一类重要方法。分类变量或离散型数据时生物学和医学领域常见的数据类型。 1、…

后端学习:数据库MySQL学习

数据库简介 数据库:英文为 DataBase,简称DB,它是存储和管理数据的仓库。   接下来,我们来学习Mysql的数据模型,数据库是如何来存储和管理数据的。在介绍 Mysql的数据模型之前,需要先了解一个概念&#xf…

“Morpheus-1”的全新人工智能模型声称能引发清醒梦境

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领…

vue3 codemirror关于 sql 和 json格式化的使用以及深入了解codemirror 使用json格式化提示错误的关键代码

文章目录 需求说明0、安装1. 导入js脚本2.配置3.html处使用4.js处理数据(1)json格式化处理(2)sql格式化处理 5. 解决问题1:json格式化错误提示报错(1)打开官网(2)打开官网&#xff0…

Python第 1 课 Python 介绍与安装

文章目录 第 1 课 Python 介绍与安装1.Python介绍1.1 面向对象概述1.2 Python 概述1.3 Python 特点 2.查看Python3.pyCharm 安装方法3.1 下载 pyCharm3.2 打开 pyCharm3.3 汉化 pyCharm3.4 pyCharm 的基本介绍和基本使用方法 第 1 课 Python 介绍与安装 1.Python介绍 1.1 面向…

qt 坦克大战游戏 GUI绘制

关于本章节中使用的图形绘制类,如QGraphicsView、QGraphicsScene等的详细使用说明请参见我的另一篇文章: 《图形绘制QGraphicsView、QGraphicsScene、QGraphicsItem、Qt GUI-CSDN博客》 本文将模仿坦克大战游戏,目前只绘制出一辆坦克&#…

应急消防应用步入“繁花”时代,卓翼智能消防无人机顺势而行大有可为

近日,北京卓翼智能科技有限公司(以下简称“卓翼智能”)宣布完成超亿元B轮融资,融资金额高达2.5亿元。这个“智能无人系统”黑马品牌,凭什么出圈?重点发力在哪些领域呢?今天,带你走进…

Spring Boot使用AOP

一、为什么需要面向切面编程? 面向对象编程(OOP)的好处是显而易见的,缺点也同样明显。当需要为多个不具有继承关系的对象添加一个公共的方法的时候,例如日志记录、性能监控等,如果采用面向对象编程的方法&…

【C语言】socket编程接收问题

一、recv()函数接收到的返回值为0表示对端已经关闭 在TCP套接字编程中,通过recv()函数接收到的返回值为0通常表示对端已经关闭了套接字的发送部分。这是因为TCP是一个基于连接的协议,其中有定义明确的连接建立和终止流程;当对端调用close()或…

matlab appdesigner系列-仪器仪表1-圆形仪表、半圆形仪表、90度仪表、线性仪表

圆形仪表、半圆形仪表、90度仪表、线性仪表,是4种仪表的不同样式。 示例:用滑块,来调整仪表 操作步骤: 1)将圆形仪表、半圆形仪表、90度仪表、线性仪表、滑块拖拽到画布上 2)设置滑块的回调函数 changin…

MySQL 覆盖索引

目录 一、什么是索引 二、索引的有哪些种类? 三、InnoDB的不同的索引组织结构是怎样的呢? 四、什么是覆盖索引 五、如何使用是覆盖索引? 六、如何确定数据库成功使用了覆盖索引呢 总结: 一、什么是索引 索引(在 …

JVM篇:垃圾回收算法

标记清除 通过遍历GC Root后得到不再被引用的对象,对没被引用的对象做一个标记处理,然后对其进行清除。 优点:速度快 缺点:会产生内存碎片,可能会导致空闲的内存足够保存对象,但由于不连续而保存失败。 标…

阿里云部署配置幻兽帕鲁Palworld联机服务器详细教程

阿里云作为国内领先的云计算服务提供商,为企业和个人提供了丰富的云服务。本文将为大家详细介绍如何在阿里云上配置幻兽帕鲁Palworld联机服务器,以便与更多玩家共同体验游戏的乐趣。 第一步:登录服务器创建页 1、进入幻兽帕鲁联机服务快速部…

vue3添加pinia

概述:Pinia 是一个专为 Vue.js 开发的状态管理库。Vue.js 是一个流行的 JavaScript 框架,用于构建用户界面。Pinia 旨在提供一个简单、灵活且性能高效的状态管理方案,使开发者能够更容易地管理应用的状态。 以下是 Pinia 的一些特点和概念&a…

技术变革下职业危机

方向一:技术变革 1.人工智能(AI):AI技术的快速发展正在改变各个行业。AI在医疗诊断、金融分析、客户服务以及物流管理等方面都有广泛应用,提高了效率和准确性。但同时也引发了一些道德和道德问题,比如隐私…

###C语言程序设计-----C语言学习(4)#

前言:感谢老铁的浏览,希望老铁可以一键三连加个关注,您的支持和鼓励是我前进的动力,后续会分享更多学习编程的内容。现在开始今天的内容: 一. 主干知识的学习 1.字符型数据 (1)字符型常量 字…

HCS-华为云Stack-FusionSphere

HCS-华为云Stack-FusionSphere FusionSphere是华为面向多行业客户推出的云操作系统解决方案。 FusionSphere基于开放的OpenStack架构,并针对企业云计算数据中心场景进行设计和优化,提供了强大的虚拟化功能和资源池管理能力、丰富的云基础服务组件和工具…

实体关系抽取与属性补全的技术浅析

目录 前言1. 实体关系抽取2 实体关系抽取的方法2.1 基于模板的方法2.2 基于监督学习的关系抽取2.3 基于深度学习的关系抽取2.4 基于预训练语言模型的关系抽取 3 属性补全3.1 属性补全任务简介3.1 抽取式属性补全3.2 生成式属性补全 4 未来发展趋势结语 前言 在信息爆炸时代&am…

[网鼎杯 2018]Fakebook1

join一个用户后,点进去发现是这样的 查看这个页面的源代码,发现一个base64编码后的字串 decode之后就是我们join新用户时填入的blog网址 那我们是不是可以通过填入存储flag的地址,从而回显出来呢?当然,先按照常规sqli…

【Go】深入理解 Go map:赋值和扩容迁移 ①

文章目录 map底层实现hmapbmap map hash冲突了怎么办? map扩容触发扩容时机扩容小结为什么map扩容选择增量(渐进式扩容)?迁移是逐步进行的。那如果在途中又要扩容了,怎么办? map翻倍扩容原理 map写入数据内…