【RISC-V】站在巨人的肩膀上——看开源芯片、软件生态、与先进计算/人工智能/安全的结合

目录

    • 会议议程
    • 专题二:RISC-V与先进计算
      • 基于RISC-V的后量子密码芯片设计,刘冬生,华中科技大学
      • 存算一体集成芯片,刘琦,复旦大学
      • 面向端侧大模型计算的RISC-V矩阵扩展架构,复旦大学,韩 军
    • 专题五:RISC-V与安全
      • 处理器侧信道攻击 吕勇强 清华大学

2024年5月19日,雁栖青年论坛 RISC-V生态专题论坛。
站得高,才能看得远,学习前沿知识,用于今后职业发展的方向指导。

会议议程

在这里插入图片描述

专题二:RISC-V与先进计算

基于RISC-V的后量子密码芯片设计,刘冬生,华中科技大学

b站视频传送门:基于RISC-V的后量子密码芯片设计,刘冬生,华中科技大学 国家集成电路学院、国家集成电力产教融合创新平台
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 基于格的方案更具优势

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 三种安全等级对应不同维度

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

存算一体集成芯片,刘琦,复旦大学

b站视频传送门:存算一体集成芯片,刘琦,复旦大学芯片与系统前沿技术研究院 集成芯片与系统全国重点实验室
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 新原理存储器:电荷极化型——铁电存储器、自旋磁矩——自旋磁存储器、晶格结构变化的相变存储器、导电熔丝机制的阻变存储器

在这里插入图片描述

  • 三明治结构(金属、介质、金属)

在这里插入图片描述
在这里插入图片描述

  • 三种方式,终极目标是存内计算,主要为了解决神经网络-矩阵乘加运算

在这里插入图片描述

  • 矩阵乘加是神经网络基本算子。模拟存算一体,利用:欧姆定律实现乘法(电压x电导=电流)+ 基尔霍夫定律实现加法(计算电流累加)→ 矩阵乘加,高能效、精度偏低。数字存算一体,定制化乘法器+数字加法器→高精度、高能效

在这里插入图片描述

  • 阻变存储器(RRAM)性能更具优势

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • RRAM耐久性不够,不适合系数频繁刷新。SRAM更适合频繁擦写,两者结合,实现更好的能效

在这里插入图片描述

  • 优化矩阵乘、线性方程组求解通用算子

在这里插入图片描述
在这里插入图片描述

  • Chiplet模式,

在这里插入图片描述

  • 集成芯片结构,有希望用14nm工艺将性能接近于5nm芯片性能

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • AI芯片的发展离不开:器件、架构、集成技术的创新
    在这里插入图片描述

面向端侧大模型计算的RISC-V矩阵扩展架构,复旦大学,韩 军

b站视频传送门:面向端侧大模型计算的RISC-V矩阵扩展架构,复旦大学,集成芯片与系统全国重点实验室,韩 军

  • Transformer Encoder核心是矩阵乘加运算、RISC-V向量扩展架构(平头哥向量处理器)

在这里插入图片描述

  • 矩阵扩展指令集,更适合端侧大模型计算

在这里插入图片描述

  • 发展AI电脑、智能移动设备,

在这里插入图片描述

  • 算力越多越好、端侧的算力却通常较小,算力指标有最低要求
    把握新机遇弄潮新基建 平头哥发布1520计划

在这里插入图片描述

  • RISC-V 矩阵扩展指令集,提供了更大操作数粒度。可设计二维矩阵乘,提升计算效率。支持更高并发度,一起64位访存,加大粒度实现连续访存,有效利用存储带宽。

在这里插入图片描述

  • 核心架构:二维计算阵列(神经网络加速器都会有)、Matrix RISC-V(多维向量并行访问)、矩阵访存单元(支持连续、高带宽访存,以及访存请求的合并)

在这里插入图片描述

  • 整合矩阵计算能力+通用计算,需要领域专用处理器接口(指令接口、L1访存接口、L2访存接口),DSA架构

在这里插入图片描述

  • 接口优点:专用Core与通用Core——实现硬件解耦、专用Core共用软件栈且复用编译环境——实现软件统一,硬件加速与软件统一。

在这里插入图片描述

  • 采用二级译码结构,将宏指令译码为微指令,再执行

在这里插入图片描述

  • 三级流水线,访存、Matrix计算、CSR和寄存器堆可配置

在这里插入图片描述

  • 超标量的思想,支持乱序执行。编译友好、L1L2访存、指令组合代替非线性操作单元

在这里插入图片描述

  • DSA的通用处理器实现了可接入通用编译流程,
    平头哥RISC-V 工具链-HHB神经网络模型部署工具

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • AI PC高算力要求的场景,采用多核多die并行;

在这里插入图片描述

  • 移动端小算力需求场景,采用大小核方式

在这里插入图片描述
在这里插入图片描述

专题五:RISC-V与安全

处理器侧信道攻击 吕勇强 清华大学

b站视频传送门:Microarchitectural Side Channels处理器侧信道攻击 吕勇强 清华大学 副研究员

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 处理器漏洞:私密性、完整性、可用性

在这里插入图片描述

  • 架构指程序员能看到的部分,微架构程序员看不见(为了完成架构的功能)

在这里插入图片描述
在这里插入图片描述

  • 供电(从power状态进行远程密码破译)、

在这里插入图片描述
在这里插入图片描述

  • 常见物理信道:物理、能量等,攻击者在信道上对受害者进行观测,能得出受害者在做什么。所以攻击侧对受害侧所做的行为有一定的白盒知识,才能更好的获取信息

在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/682649.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

电子电气架构 —— 刷写模式:并行刷写

电子电气架构 —— 刷写模式:并行刷写 我是穿拖鞋的汉子,魔都中坚持长期主义的工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 人们会在生活中不断攻击你。他们的主要武器是向你灌输对自己的怀疑:你的价值、你的能力、你的潜力。他们往往会将此…

云原生架构案例分析_5.某体育用品公司云原生架构的业务中台构建

1.背景和挑战 某体育用品公司作为中国领先的体育用品企业之一,在2016年,某体育用品公司启动集团第三次战略升级,打造以消费者体验为核心的“3”(“互联网”、“体育”和“产品”)的战略目标,积极拥抱云计算…

基于GFlowNets的蚁群抽样组合优化

本文将基于GFACS论文,探讨其核心思想、技术细节以及在实际应用中的优势。 GFlowNet:摊销MCMC成本的有效工具 GFACS的核心是GFlowNet,它通过训练学习状态转移的概率分布,从而替代传统的MCMC采样方法。GFlowNet的优势在于&#xff1…

Java——循环语句

下面我们介绍循环控制结构。如果您想要同样的操作执行多次,就需要使用循环结构。Java中有三种主要的循环结构: for 循环while 循环do…while 循环 一、for 循环 for循环是一种控制结构,用于反复执行一段代码,直到满足指定的条件…

每天五分钟深度学习PyTorch:Tensor张量的索引和切片

本文重点 有时候当我们拥有一个Tensor张量的时候,我们可能需要获取它某一维度的信息,那么此时我们就需要索引和切片的技术,它们可以帮助我们解决这些问题。 切片操作 a是四维的,然后默认是从第一维开始取,逗号表示取不同的维度 a[:2]表示第一维取0,1,后面三维取所有 …

JAVA小案例-分别计算100以内奇数和偶数的和

JAVA小案例-分别计算100以内奇数和偶数的和 没啥可说的,就是for循环加if分支,也可以用while写。 代码如下: public class Jiouhe {/*** 分别计算100以内奇数和偶数的和* param args*/public static void main(String[] args){int sum10;in…

C语言数据结构快速排序的非递归、归并排序、归并排序的非递归等的介绍

文章目录 前言一、快速排序非递归二、归并排序五、归并排序非递归总结 前言 C语言数据结构快速排序的非递归、归并排序、归并排序的非递归等的介绍 一、快速排序非递归 快速排序非递归的定义 快速排序非递归,需要使用栈来实现。将左右下标分别push到栈中。在栈为…

【ubuntu软件版本管理】利用update-alternatives管理ubuntu软件

​ 我们有的时候希望在安装了新软件之后保留旧版本的软件,比如希望保留旧版本的gcc,以防以前写的C编译出问题,这时候就需要版本管理软件update-alternatives。 ​ 在此之前我们需要先弄清楚,什么是ubuntu的软件?拿C源…

微服务开发与实战Day02 - Docker

一、Docker快速入门 快速构建、运行、管理应用的工具 安装部署教程:Docs 1. 部署MySQL 测试连接: 镜像和容器 当我们利用Docker安装应用时,Docker会自动搜索并下载应用镜像(image)。镜像不仅包含应用本身&#xff…

Go微服务: 基于rocketmq:5.2.0搭建RocketMQ环境,以及示例参考

概述 参考最新官方文档:https://rocketmq.apache.org/zh/docs/quickStart/03quickstartWithDockercompose以及:https://rocketmq.apache.org/zh/docs/deploymentOperations/04Dashboard综合以上两个文档来搭建环境 搭建RocketMQ环境 1 ) 基于 docker-c…

RTOS笔记--任务状态与调度

任务状态 freertos中的任务分为四个状态:就绪状态(ready)、运行状态(running)、阻塞状态(blocked)、暂停状态(suspended) 完整的任务状态转换图: 在使用vTas…

04--Tomcat

前言:本章整理tomcat的知识点,tomcat知识点相较nginx比较少,但是也是运维必会的软件,这里结合实际项目整理一下。 1、tomcat简介 Tomcat 服务器是一个免费的开放源代码的Web 应用服务器,属于轻量级应用服务器&#x…

在线建站流程分析

建站流程是指通过互联网创建一个个人或企业网站的过程。随着互联网的发展,越来越多的人和机构开始意识到网络的重要性,建站成为一种常见的行为。在线建站的流程一般包括以下几个步骤。 首先,选择一个合适的建站平台。目前,有很多在…

英伟达Docker 安装与GPu镜像拉取

获取nvidia_docker压缩包nvidia_docker.tgz将压缩包上传至服务器指定目录解压nvidia_docker.tgz压缩包 tar -zxvf 压缩包执行rpm安装命令: #查看指定rpm包安装情况 rpm -qa | grep libstdc #查看指定rpm包下的依赖包的版本情况 strings /lib64/libstdc |grep GLI…

这才是大模型价格战背后的真相

想必大家今天肯定被各家大模型厂商的降价新闻刷圈了,如果说 Meta Llama 3 的开源是国外大模型市场的搅局者,那 DeepSeek-V2 就是国内大模型市场的鲶鱼,但是价格战背后是大模型基础设施优化带来的物美价廉,还是浑水摸鱼的噱头&…

数据结构——(java版)包装类与泛型

文章目录 一 包装类1.1 包装类的概念1.2 装箱/装包1.3 拆箱/拆包1.4 一个面试题: 二 泛型2.1 什么是泛型?2.2 泛型的使用2.3 泛型的上界2.4 泛型实现Comparable接口2.5 擦除机制另外: 一 包装类 1.1 包装类的概念 在java中基本数据类型并不…

中国自动气象站:现代气象观测的中流砥柱

引言 气象观测是人类认识和预报天气的重要手段。在现代科技的推动下,自动气象站成为气象观测的重要工具,为天气预报、防灾减灾和气候研究提供了宝贵的数据支持。本文将介绍中国自动气象站的发展历程、技术特点及其在气象观测中的重要作用。 中国自动气象…

【Linux】信号(一)

信号我们将从信号产生,信号的保存,信号处理分别进行讲解~ 至少大思路是这样。开始之前还要进行一些基础知识的铺垫。 目录 从生活中提炼一些结论:信号概念的一些储备:信号产生:一、kill指令:二、键盘组合键…

BP 客户主数据-国际贸易条款发生更改

Issue :ECC升级S4后 1)客户主数据扩产线时(LHGX03),国贸条件2变更记录查询时,所扩产线(30 1C)无变更记录,未变更产线(10 1C/1H/1M)确认变更记录 20230108新增&#xff1…

生命在于学习——Python人工智能原理(3.2)

三、深度学习 (二)人工神经网络 人工神经网络是模仿人类大脑神经系统工作原理所创建的数学模型,有并行的分布处理能力、高容错性和自我学习等特征。 1、感知器 感知器由Frank Roseblatt于1957年提出,是一种广泛使用的线性分类…