小型 FPGA 瞄准 4K 视频接口,MiSTer FPGA 现已支持 Sinden 光枪-FPGA新闻速览

无需矩阵乘法,在 FPGA 上实现低功耗、高性能的 LLM

UC Santa Cruz, Soochow University, UC Davis 和 LuxiTech 发表了一篇题为“可扩展的无 MatMul 语言建模”的新技术论文。

“矩阵乘法 (MatMul) 通常占据大型语言模型 (LLM) 总体计算量的主导地位。随着 LLM 扩展到更大的嵌入维度和上下文长度,此计算量只会增加。在这项工作中,表明 MatMul 操作可以完全从 LLM 中消除,同时在十亿参数规模下保持强劲性能。实验表明,我们提出的无 MatMul 模型实现了与最先进的 Transformers 相当的性能,后者在推理期间需要更多的内存,规模至少达到 2.7B 参数。我们研究了缩放规律,发现我们的无 MatMul 模型和全精度 Transformers 之间的性能差距随着模型尺寸的增加而缩小。我们还提供了此模型的 GPU 高效实现,与未优化的基线相比,在训练期间可将内存使用量降低高达 61%。通过在推理过程中使用优化的内核,与未优化的模型相比,我们的模型的内存消耗可以减少 10 倍以上。为了正确量化我们架构的效率,我们在 FPGA 上构建了一个自定义硬件解决方案,该解决方案利用了 GPU 无法处理的轻量级操作。我们以超出人类可读吞吐量 13W 的功率处理了十亿参数规模的模型,使 LLM 更接近类似大脑的效率。这项工作不仅展示了 LLM 可以在大程度上精简同时仍然有效运行,而且还指出了未来加速器在处理下一代轻量级 LLM 时应该优化的操作类型。代码实现:

https://github.com/ridgerchu/matmulfreellm

技术论文(预印本)

https://arxiv.org/abs/2406.02528

大学新闻摘要

https://news.ucsc.edu/2024/06/matmul-free-llm.html

来源:

Zhu, Rui-Jie, Yu Zhang, Ethan Sifferman, Tyler Sheaves, Yiqiao Wang, Dustin Richmond, Peng Zhou, and Jason K. Eshraghian. “Scalable MatMul-free Language Modeling.” arXiv preprint arXiv:2406.02528 (2024).

Lattice将固定硬件的安全性与 FPGA 的灵活性相结合

莱迪思半导体公司是低功耗、低成本 FPGA 行业的长期参与者,最近发布了 MachXO5D-NX 系列。该中端系列将低成本、低功耗与各种外设和安全功能相结合,使其适用于安全边缘设备。

92ad9101172ff800a539972a1e39a603.jpeg

该三款芯片系列:

  • FMXO5-25:27k逻辑单元

  • LFMXO5-55T : 53k 逻辑单元

  • LFMXO5-100T:96k 逻辑单元

该系列的其他功能包括 20 到 156 个 sysDSP 18x18 乘法器和 1.9 Mb 到 7.3 Mb 的 EBR 或 LRAM 形式的嵌入式 RAM。该系列还拥有 200 到 300 个高性能、宽范围和多电压 I/O。

e3f6f5d999f923c2cd56e40369f9d872.pngMachXO5-NX DSP 模块和寄存器布局

信任根 (RoT) 是芯片上的安全区域,其中包含用于加密功能的密钥。MachXO5D-NX 系列成员配备硬硅加密引擎,该引擎具有高级加密标准 (AES)、散列算法和真随机数生成器 (TRNG)。每个都包含一个唯一的秘密身份 (USID),以保护设备身份,从而提高安全性。

aa1ee4c20b645a88b4603738fc04742e.pngMachXO5-NX DSP 加密引擎框图

来源:https://www.latticesemi.com/about/newsroom/pressreleases/2024/lattice-introduces-new-secure-control-fpga-family

小型 FPGA 面向 4K 视频接口,配备硬核 MIPI C-PHY

今年在Sensors Converge 2024上,高云半导体发布了一款新型FPGA——GW5AT-15,该设备内置硬核MIPI接口。

9e1a067ad26d974a4cb2fc172a2c8512.pngEETech 工程总监 Dale Wilson(左)在 Sensors Converge 2024 上会见了 Gowin 首席执行官 Jason Zhu,以了解有关该公司最新 FPGA 的更多信息

随着电子设备尺寸缩小、性能提升,设计人员必须在处理器面积和功能之间取得平衡。GW5AT-15 是 Gowin 基于 SRAM 的 Arora V FPGA 的最新成员,可帮助设计人员快速高效地传输数据,而无需使用笨重的设备。

GW5AT-15 FPGA 包括三通道 MIPI C-PHY(5.75 Gbps/通道)、四通道 PCIe 3.0 和四通道 MIPI D-PHY(2.5 Gbps/通道),适用于高速应用。板载 USB 3.x 和 2.x PHY 进一步扩展了设备的实用性。

e6bdfc5899e5587eeffaf7f41f58dd05.pngMIPI C-PHY 眼图突出显示了使用硬核 PHY 所带来的性能提升,使设计人员能够根据自己的需求分配更多的逻辑单元 2252ae5a9cd74dd66f639ac5c8cf69a7.pngGW5AT-15 的紧凑特性使其能够融入更多设计中

Jason Zhu表示:“我们站在 FPGA 行业巨人的肩膀上,但我们仍将继续寻求为行业带来新的想法。”

MiSTer FPGA 现已支持 Sinden 光枪

目前支持 NES、SNES、Genesis 和 PS1 核心。

11e4f68ad5a40f73770c6edd9d798177.png

MiSTer 完全支持 Sinden,这意味着现在可以按照原有的方式玩《Duck Hunt》、《Time Crisis》和《Battle Clash》等光枪游戏。

https://github.com/MrLightgun/MiSTerSindenDriver

上面链接中有完整的安装指南,长话短说,在做使用之前,需要确保你的 Sinden 运行的是最新的 v1.09 固件。

核心目前仅限于 NES、PS1、Mega Drive / Genesis 和 SNES,但是这绝不是最终成品,因此不要期望所有这些核心都具有 100% 的兼容性。

然而,核心和驱动程序的开发工作仍在继续,预计未来将添加 Master System、Sega CD 和 Saturn 支持。

“我们正在等待世嘉的回复”——SuperSega FPGA 游戏机团队正在讨论价格、发布日期等

5079e20d44a529151271497c8ac2d89c.png

SuperSega 承诺将通过 Virtex Ultrascale+ FPGA 芯片运行 Master System、Mega Drive、Saturn 和 Dreamcast 游戏。

据负责该项目的克里斯蒂娜·布尔格斯 (Cristina Burgués) 介绍,SuperSega 的诞生就是为了通过一款能够运行世嘉所有经典软件的一体化“超级游戏机”来扩展统一游戏库这一概念。布尔格斯开玩笑地补充说,“SuperSega”与“Super Nintendo”形成鲜明对比。

aee6c84fae8646626cc9e5d9dee24680.pngSuperSega 首席工程师 Alejandro Martin

SuperSega 声称能够使用 FPGA 复制 Dreamcast 级别的性能,Burgués 回答说“一些游戏”已经启动并运行,并且 Ultrascale+ 有“100K-200K 个逻辑单元可以模拟 Dreamcast 行为”。

f11ca7351b4ee66a3637638e676df95d.png

由于原型板仍在开发中,因此发布日期有些难以确定。“我们预计这些板将在假期后完成,也就是 9 月到 10 月之间。之后,我们将专注于完成 FPGA 核心,然后是 GUI。我们希望在今年年底前筹集资金或以其他方式获得资金。目前,我们的工作仍在进行中。”

7896a9da3c796f092ce761b20fdf967d.png

抗辐射 MCU 可在太空中实现 FPGA 重构

267c404b0d7ac79c404df3015f019855.png

AMD 和 Vorago Technologies 携手合作,支持 AMD 太空级 Kintex UltraScale FPGA 与 Vorago 抗辐射微控制器的重新配置。

Vorago 抗辐射 ARM Cortex-M4 MCU(例如 VA41620)允许通过 AMD 的串行重新配置接口在运行中管理更新,从而简化了 FPGA 的重构(相对于传统方法)。

凭借高达 300 krad(Si) TID 和 >110 MeV*cm2/mg 的 SEL,抗辐射 MCU 可提供抗辐射能力,以承受太空中遇到的恶劣条件,适用于系统级单事件监控和电机控制等应用。

优秀的 Verilog/FPGA开源项目介绍(十二)- 玩FPGA不乏味

36c654b3ff9f2d43f38120350c77e683.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/796735.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

PLC物联网关在工业自动化领域的应用的意义-天拓四方

随着信息技术的飞速发展,物联网技术正逐步渗透到各个行业领域,其中,工业自动化领域的PLC与物联网的结合,为工业自动化的发展开辟了新的道路。PLC物联网关作为连接PLC与物联网的重要桥梁,其重要性日益凸显。 PLC物联网…

单例模式Singleton

设计模式 23种设计模式 Singleton 所谓类的单例设计模式,就是采取一定的方法保证在整个的软件系统中,对某个类只能存在一个对象实例,并且该类只提供一个取得其对象实例的方法。 饿汉式 public class BankTest {public static void main(…

四个“一体化”——构建数智融合时代下的一站式大数据平台

随着智能化技术的飞速发展,尤其是以生成式AI为代表的技术快速应用,推动了数据与智能的深化融合,给数据基础设施带来了新的变革和挑战。如何简化日益复杂的系统架构,提高数据处理效率,降低开发运维成本,促进…

Selenium使用注意事项:

find_element 和 find_elements 的区别 WebDriver和WebElement的区别 问题: 会遇到报错: selenium.common.exceptions.NoSuchElementException: Message: no such element: Unable to locate element: {"method":"css selector",&…

STM32智能空气质量监测系统教程

目录 引言环境准备智能空气质量监测系统基础代码实现:实现智能空气质量监测系统 4.1 数据采集模块 4.2 数据处理与控制模块 4.3 通信与网络系统实现 4.4 用户界面与数据可视化应用场景:空气质量监测与优化问题解决方案与优化收尾与总结 1. 引言 智能空…

UCSD和MIT的华人学者最新成果展示:沉浸式远程遥操作机器人

你是否曾想过,自己身处某地,可以控制几千公里以外的「机器人」本体?这个想法,最近被来自UCSD和MIT的华人学者们实现了。UCSD位于加利福尼亚州,MIT位于马萨诸塞州,这两地之差,约3000英里&#xf…

线性回归(梯度下降)

首先说案例: 房子的价格和所占面积有着很大的关系,假如现在有一些关于房子面积和价格的数据,我要如何根据已经有的数据来判断未知的数据呢? 假如x(房屋面积),y(房屋价格) x[ 56 72 69 88 102 86 76 79 94 74] y[92, …

MySQL 锁分类

MySQL 锁分类 在 MySQL 中,为了保证并发性能和数据安全,有多种锁机制。我们常见的有表级锁和行级锁。让我们一起来学习 MySQL 中各种锁的知识。 表级锁 表级锁是对整张表进行锁定。 表数据锁 1. 读锁 允许多个会话同时读取同一张表的数据&#xff…

大模型时代的目标检测

https://zhuanlan.zhihu.com/p/663703934https://zhuanlan.zhihu.com/p/6637039341.open set/open word/ood 这个任务是指在实际应用上可以检测任何前景物体,但是有些不需要预测类别,只要检测出框就行。在很多场合也有应用场景,有点像类无关…

HyperSD - 会画草图就能玩AI绘画,AI一键手绘,实时同步 本地一键整合包下载

字节跳动的Lightning团队发布的新图像模型蒸馏算法Hyper-SD,是一项在图像处理和机器学习领域的重要进展。这项技术通过创新的方法提升了模型在不同推理步骤下的性能,同时保持了模型大小的精简。 基于这个算法模型,一个很实用的功能出现了&am…

知识图谱入门笔记

自学参考: 视频:斯坦福CS520 | 知识图谱 最全知识图谱综述 详解知识图谱的构建全流程 知识图谱构建(概念,工具,实例调研) 一、基本概念 知识图谱(Knowledge graph):由结…

本地部署,MODNet 背景去除大模型

目录 摘要 引言 MODNet 架构 关键组件 技术原理 本地部署 运行结果 结论 GitHub - ZHKKKe/MODNet: A Trimap-Free Portrait Matting Solution in Real Time [AAAI 2022]A Trimap-Free Portrait Matting Solution in Real Time [AAAI 2022] - ZHKKKe/MODNethttps://gith…

【Linux】软件管理工具 yum

文章目录 概念搜索:yum list安装:yum install卸载:yum remove 概念 在Linux下安装软件,可以下载到程序的源代码,进行编译得到可执行程序,另外这些软件还有依赖其它工具的问题,还得下载编译这些依…

鸿蒙小练习

bean对象 export class BannerImage{id:numberurl:stringtargetUrl:stringproductId:numberconstructor(id: number, url: string, targetUrl: string, productId: number) {this.id idthis.url urlthis.targetUrl targetUrlthis.productId productId} }export class d…

嵌入式应用开发之模块驱动移植教程

前言:本篇主要面向小白的小伙伴,提供一些基础的模块移植教程,不涉及预处理指令类的移植教程。 #为什么要移植驱动 这个问题,可以来说是显而易见的,在标准库的开发过程中,如果重新写一个模块的驱动,从串行通…

Autosar Dcm配置-0x28服务ComControl-基于ETAS软件

文章目录 前言DcmDcmDsdDcmDspBswMBswMModeRequestPortBswMModeConditionBswMLogicalExpressionBswMActionBswMActionListBswMRule总结前言 0x28服务主要用来控制非诊断报文的通讯,一般在刷写预编程过程中,用来禁止APP的通信报文,可以减少总线负载率,提高刷写成功率。本文…

【Orange Pi AI Pro】开箱体验完,发现是真的强!!!

最近香橙派联合华为出了一款新的AI开发板——Orange Pi AI Pro,关键是搭载了昇腾AI处理器提供了8TOPS INT8的算力,作为一个嵌入式的CSDN博主,当然得体验一下这款新产品。 文章目录 1 开箱2 硬件介绍2.1 开发板硬件详情:2.2 顶层视…

分享浏览器被hao123网页劫持,去除劫持的方式

昨天看python相关的自动化工作代码时,发现谷歌浏览器被hao123劫持了,把那些程序删了也不管用 方法1:删除hao123注册表,这个方式不太好用,会找不到注册表 方法2:看浏览器快捷方式的属性页面,一…

keil5新建stm32工程的基本

1、建立工程文件夹,keil中新建工程,选择型号; 2、工程文件夹里建立自己所需要的文件夹等,复制固件库里面的文件到工程文件夹里; 3、将工程里建立对应的同名的分组,并将文件夹内的文件添加到工程分组中。 点…

MQTT——Mosquitto使用(Linux订阅者+Win发布者)

前提:WSL(Ubuntu22)作为订阅者,本机Win10作为发布者。 1、Linux安装Mosquitto 命令行安装。 sudo apt-get install mosquitto 以上默认只安装了mosquitto的服务,不带测试客户端工具mosquitto_sub和mosquitto_pub。如…