模拟量化面试20问回答

模拟量化面试20问回答

article2025/2/19 7:41:08/文章来源:https://blog.csdn.net/t765833631/article/details/137504094

原文链接
参考链接

量化的基本公式

对称均匀量化（symmetric uniform quantization）

对称量化将零点z限制为真实的0。注意对称均匀量化并不是关于零点对称。它还分为有符号和无符号。

signed量化公式

在这里插入图片描述

signed量化范围

8bit量化范围[-128, 127]

signed缩放系数

在这里插入图片描述 ### signed零点计算方法
Z = 0

unsigned 量化公式

在这里插入图片描述

unsigned量化范围

8bit的量化范围[0,255]

unsigned缩放系数计算方法

在这里插入图片描述 ### unsigned零点计算方法
Z = 0

反量化公式

在这里插入图片描述

非对称量化（Asymmetric uniform quantization）

即均匀仿射量化（uniform affine quantization）。

非对称量化公式

在这里插入图片描述

非堆成量化范围

[-128, 127] for signed
[0, 255] for unsigned

缩放系数

在这里插入图片描述

零点公式

Z = Qmax - round(rmax/S)

反量化公式

在这里插入图片描述

2、量化的误差来源有哪些

3、既然有误差，那为何某些业务对误差不敏感，有的又非常敏感

4、量化信息是插入tensor还是op，或者是两者都要

5、ptq量化的基本流程

6、ptq和qat的简单区别

7、常说的per tensor和per channel，对于conv2d的weight来说具体有什么区别

8、量化里常说的fake quant大概是在干什么

9、对于qat来说，fake quant在训练和推理时有什么区别

10、对称非对称，有无符号等量化选择，对于conv2d的3个输入来说一般各自采用哪种组合

11、requant的基本计算逻辑和作用

12、混合精度的基本计算逻辑

13、量化中有哪些op通常需要特殊处理

14、对于conv2d来说，multiplier，shift如何推理出来的

15、对于conv2d来说，采用multiplier，shift计算时，对bias的scale有特殊要求吗

16、对称量化时我们统计出来的浮点范围，为何要限制min≤0，max≥0

17、常见的阈值搜索方法

8bit量化带符号时，q_min选-128和-127的有区别吗

论文
来源
这里有个 Trick，即对于权重是量化到[−127,127]，这是为了累加的时候减少溢出的风险。

因为 8bit 的取值区间是[-2^7, 2^7 -1]，两个 8bit 相乘之后取值区间是 (-2^14,214]，累加两次就到了(-2^15，215]，所以最多只能累加两次而且第二次也有溢出风险，比如相邻两次乘法结果都恰好是2^14会超过215-1（int16 正数可表示的最大值）。

所以把量化之后的权值限制在（-127,127）之间，那么一次乘法运算得到结果永远会小于-128*-128 = 2^14。

19、为什么有的模型会出现中间量化误差大，后续量化误差又减少的情况

20、余弦度量在衡量量化误差上有什么优缺点

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/555243.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

相关文章

使用python进行网站答题操作

使用python进行网站答题操作

介绍： 使用Python和DrissionPage模块编写自动化脚本，以模拟人的行为访问网站并获取题目答案进行自动答题。这个脚本似乎是为答题网站设计的，通过监控特定数据包地址来获取题目答案，并模拟点击正确答案进行答题。代码中的逻辑包…

阅读更多...

List实现（2）| LinkedList

List实现（2）| LinkedList

参考：LinkedList 源码分析在Java中，LinkedList是一个双向链表，实现了List和Deque接口，可以被当作列表（List）、队列（Queue）或者双端队列（Deque）使用。它允许…

阅读更多...

[渗透测试学习] TwoMillion-HackTheBox

[渗透测试学习] TwoMillion-HackTheBox

TwoMillion-HackTheBox 信息搜集 nmap扫描一下 nmap -sV -v 10.10.11.221扫描结果 PORT STATE SERVICE VERSION 22/tcp open ssh OpenSSH 8.9p1 Ubuntu 3ubuntu0.1 (Ubuntu Linux; protocol 2.0) 80/tcp open http nginx 3851/tcp f…

阅读更多...

LeetCode第797题: 所有可能的路径

LeetCode第797题: 所有可能的路径

目录 1.问题描述 2.问题分析 1.问题描述给你一个有 n 个节点的有向无环图（DAG），请你找出所有从节点 0 到节点 n-1 的路径并输出（不要求按特定顺序）。 graph[i] 是一个从节点 i 可以访问的所有节点的列表&#xff08…

阅读更多...

解决IDEA https://start.spring.io/连接不上

解决IDEA https://start.spring.io/连接不上

1.换成下边这个地址试试 https://start.springboot.io/2.换成阿里云试试，绝对可行，但是版本有点低 https://start.aliyun.com

阅读更多...

使用Java调用音乐开放API，并进行播放

使用Java调用音乐开放API，并进行播放

使用Java调用音乐开放API，并进行播放背景描述电脑没有下载音乐软件，使用网页播放又不太方便，所有就想着使用Java语言直接调用音乐开放API，然后进行播放音乐。具体代码如下，包含了注释 package com.lowkey.comple…

阅读更多...

python学习笔记B-06：序列结构之列表--列表的创建和删除

python学习笔记B-06：序列结构之列表--列表的创建和删除

序列结构主要有列表、元组、字典、集合和字符串，列表是要学习的第一种序列结构。下面是列表的创建和删除方法。 import random #导入一个随机数发生器 print("创建列表方法1：直接列表名，等号，方括号中间内容用逗号隔开&quo…

阅读更多...

基于小程序实现的精准扶贫数据收集系统

基于小程序实现的精准扶贫数据收集系统

作者主页：Java码库主营内容：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app等设计与开发。收藏点赞不迷路关注作者有好处文末获取源码技术选型【后端】：Java 【框架】：ssm 【…

阅读更多...

python将xml格式文件转成png或者pdf格式

python将xml格式文件转成png或者pdf格式

本文主要介绍运行NCCL代码时输出的xml文件该如何转成更加容易观看的图格式如下是举例，服务器上的PCIE相关的topo xml 文件 <system version"1"><cpu numaid"1" affinity"ffffff00,0000ffff,ff000000" arch"x86_64&q…

阅读更多...

$AWB学习记录$

AWB学习记录

主要参考食鱼者博客：https://blog.csdn.net/wtzhu_13/article/details/119301096，以及相关的论文，感谢食鱼者老师整理分享。灰度世界和完全反射灰度世界法和完全反射法分别是基于(Rmean, Gmean, Bmean)和(Rmax, Gmax, Bmax)来进行白平衡校…

阅读更多...

内部类

内部类

一.概念当一个事物内部，还有一个部分需要一个完整的结构进行描述，而这个内部的完整的结构又只为外部事物提供服务，那么将这个内部的完整结构最好使用内部类。在Java中，可以将一个类定义在另一个类或者一个方法内部，前…

阅读更多...

第46篇：随机存取存储器（RAM）模块＜五＞

第46篇：随机存取存储器（RAM）模块＜五＞

Q：本期我们使用Quartus软件的IP Catalog工具创建双端口RAM。 A：前期创建的RAM存储模块只有一个端口，同时为读/写操作提供地址。我们将再创建一个具有两个地址输入端口的RAM模块，分别为读操作和写操作提供地址。选择Basic Functio…

阅读更多...

2000-2022年各省人力资本水平数据（含原始数据+计算过程+计算结果）（无缺失）

2000-2022年各省人力资本水平数据（含原始数据+计算过程+计算结果）（无缺失）

2000-2022年各省人力资本水平数据（含原始数据计算过程计算结果） 1、时间：2000-2022年 2、来源：国家统计局 3、指标：普通高等学校在校学生数(万人)、年末常住人口（万人）、人力资本水平 4、范…

阅读更多...

网络编程day6

网络编程day6

#include <myhead.h> void Insert_Record(sqlite3* ppDb); // 插入记录 void Delete_Record(sqlite3* ppDb); // 删除记录 void Update_Record(sqlite3* ppDb); // 修改记录 int main(int argc, const char *argv[]) { //1、定义一个数据库句柄指针sqlite3 * ppDb NULL;…

阅读更多...

面试经典150题——相同的树

面试经典150题——相同的树

1. 题目描述 2. 题目分析与解析要编写一个判断两棵二叉树是否完全相同的代码，首先需要理解何谓“完全相同”的二叉树。完全相同意味着两棵树的结构完全一致，并且所有对应的节点上的值也必须相同。 1. 定义问题首先明确问题定义：给定…

阅读更多...

RC4Drop加密技术：原理、实践与安全性探究

RC4Drop加密技术：原理、实践与安全性探究

title: RC4Drop加密技术：原理、实践与安全性探究 date: 2024/4/18 20:47:30 updated: 2024/4/18 20:47:30 tags: RC4算法流加密安全性RC4Drop技术密钥流加密解密网络通信第一章：介绍 1.1 加密技术的重要性加密技术在当今信息社会中扮演着至关重要的…

阅读更多...

R语言计算：t分布及t检验

R语言计算：t分布及t检验

t分布理论基础 t分布也称Student’s t-distribution，主要出现在小样本统计推断中，特别是当样本量较小且总体标准差未知时，用于估计正态分布的均值。其定义基于正态分布和 X 2 X^{2} X2分布（卡方分布）。如果随机变量X服…

阅读更多...

Matlab r2023b Simulink 给子系统添加封面

Matlab r2023b Simulink 给子系统添加封面

写这篇记录的原因是，r2023b版本里改动了自定义封面的界面，而我是一个新手小白，零基础，探索一天之后发现实现方法。最终效果如图： 步骤1：打开软件，点击Simulink，再打开含有子系统的工…

阅读更多...

【基础】在GCC中编译和链接不是一个命令

【基础】在GCC中编译和链接不是一个命令

在 GCC（GNU Compiler Collection）中，编译和链接不是一个命令。编译是将源代码转换为目标代码的过程。它主要进行语法检查、词法分析、生成中间代码等操作。链接是将多个目标文件和库文件组合成一个可执行文件的过程。在 GCC 中，通…

阅读更多...

Cesium实现加载离线地形数据（nginx发布数据，cesiumLab地形切片数据）

Cesium实现加载离线地形数据（nginx发布数据，cesiumLab地形切片数据）

实现效果如图： 详细步骤 1 下载地形数据（DEM） 下载地址：地理空间数据云 (gscloud.cn) 操作步骤： 注意：第3步可以自主选择DEM的分辨率，然后下载。下载结果解压后如下图： 2 使用…

阅读更多...

最新文章