深入理解OS--数值编码

信息的表示和处理

寻址和字节顺序

在这里插入图片描述
位于0x100处,int类型值0x01234567在大端和小端下的存储。
字符串的存储不受字节序影响。

移位

1.对左移,右边统一补0
2.对右移,分为算术右移,逻辑右移
算术右移下,左边补原最高有效位
逻辑右移下,左边补0
默认对有符号数采用算术右移,对无符号数采用逻辑右移。

无符号编码

x → = [ x w − 1 , x w − 2 , . . . , x 0 ] \overrightarrow{x} = [x_{w-1}, x_{w-2}, ... , x_0] x =[xw1,xw2,...,x0]
B 2 U w ( x → ) = ∑ i = 0 w − 1 ( x i ∗ 2 i ) B2U_{w}(\overrightarrow{x})=\displaystyle\sum_{i=0}^{w-1}(x_i*2^i) B2Uw(x )=i=0w1(xi2i)

1.给定一个w个二进制数组组成的序列,B2U_w是对此序列进行的一种解释,解释的结果是将w个二进制数组成的序列映射为一个数值。
2.B2U_w将每个长度为w的位向量映射为 [ 0 , 2 w − 1 ] [0,2^w-1] [0,2w1]中一个唯一的值。
U2B_w将每个 [ 0 , 2 w − 1 ] [0,2^w-1] [0,2w1]中的值映射为一个唯一的长为w的位向量。

补码编码

x → = [ x w − 1 , x w − 2 , . . . , x 0 ] \overrightarrow{x} = [x_{w-1}, x_{w-2}, ... , x_0] x =[xw1,xw2,...,x0]
B 2 T w ( x → ) = ∑ i = 0 w − 2 ( x i ∗ 2 i ) − x w − 1 ∗ 2 w − 1 B2T_{w}(\overrightarrow{x})=\displaystyle\sum_{i=0}^{w-2}(x_i*2^i) - x_{w-1}*2^{w-1} B2Tw(x )=i=0w2(xi2i)xw12w1

1.给定一个w个二进制数组组成的序列,B2T_w是对此序列进行的一种解释,解释的结果是将w个二进制数组成的序列映射为一个数值。
2.B2T_w将每个长度为w的位向量映射为 [ − 2 w − 1 , 2 w − 1 − 1 ] [-2^{w-1},2^{w-1}-1] [2w1,2w11]中一个唯一的值。T2B_w将每个 [ − 2 w − 1 , 2 w − 1 − 1 ] [-2^{w-1},2^{w-1}-1] [2w1,2w11]中的值映射为一个唯一的长为w的位向量。

3.补码的形象解释
有符号数在计算机中是以「补码」表示的,对负数其补码就是把关联正数的二进制全部取反再加 1,比如 -1 的二进制是把数字 1 的二进制取反后再加 1
在这里插入图片描述
在这里插入图片描述
4.为何有符号数采用补码表示?
如果负数不是使用补码的方式表示,则在做基本对加减法运算的时候,还需要多一步操作来判断是否为负数,如果为负数,还得把加法反转成减法,或者把减法反转成加法,这就非常不好了,毕竟加减法运算在计算机里是很常使用的,所以为了性能考虑,应该要尽量简化这个运算过程。

而用了补码的表示方式,对于负数的加减法操作,实际上是和正数加减法操作一样的。你可以看到下图,用补码表示的负数在运算 -2 + 1 过程的时候,其结果是正确的:
在这里插入图片描述
采用补码表示下,有符号数的加法可以采用简单的二进制位逐位相加的方式。补码减法也可变形为加法来操作。

类型转换

强制类型转换的结果保持二进制位不变,只是改变对这些位解释的方式。

浮点数

1.十进制浮点数转换为二进制
在这里插入图片描述
最后把「整数部分 + 小数部分」结合在一起后,其结果就是 1000.101。但是,并不是所有小数都可以用二进制表示,前面提到的 0.625 小数是一个特例,刚好通过乘 2 取整法的方式完整的转换成二进制。

如果我们用相同的方式,来把 0.1 转换成二进制,过程如下:
在这里插入图片描述
可以发现,0.1 的二进制表示是无限循环的。
由于计算机的资源是有限的,所以是没办法用二进制精确的表示 0.1,只能用「近似值」来表示,就是在有限的精度情况下,最大化接近 0.1 的二进制数,于是就会造成精度缺失的情况。

举个例子,二进制 1010.101 转十进制的过程,如下图:
在这里插入图片描述
2.科学记数法与规格化
比如有个很大的十进制数 1230000,我们可以也可以表示成 1.23 x 10^6,这种方式就称为科学记数法。
该方法在小数点左边只有一个数字,而且把这种整数部分没有前导 0 的数字称为规格化,比如 1.0 x 10^(-9) 是规格化的科学记数法,而 0.1 x 10^(-9) 和 10.0 x 10^(-9) 就不是了。

3.浮点数的二进制存储
如果二进制要用到科学记数法,同时要规范化,那么不仅要保证基数为 2,还要保证小数点左侧只有 1 位,而且必须为 1。
所以通常将 1000.101 这种二进制数,规格化表示成 1.000101 x 2^3,其中,最为关键的是 000101 和 3 这两个东西,它就可以包含了这个二进制小数的所有信息:
(1).000101 称为尾数,即小数点后面的数字;
(2).3 称为指数,指定了小数点在数据中的位置;

现在绝大多数计算机使用的浮点数,一般采用的是 IEEE 制定的国际标准,这种标准形式如下图:
在这里插入图片描述
这三个重要部分的意义如下:
(1).符号位:表示数字是正数还是负数,为 0 表示正数,为 1 表示负数;
(2).指数位:指定了小数点在数据中的位置,指数可以是负数,也可以是正数,指数位的长度越长则数值的表达范围就越大;
(3).尾数位:小数点右侧的数字,也就是小数部分,比如二进制 1.0011 x 2^(-2),尾数部分就是 0011,而且尾数的长度决定了这个数的精度,因此如果要表示精度更高的小数,则就要提高尾数位的长度;

用 32 位来表示的浮点数,则称为单精度浮点数,也就是我们编程语言中的 float 变量,而用 64 位来表示的浮点数,称为双精度浮点数,也就是 double 变量,它们的结构如下:

在这里插入图片描述
可以看到:
(1).double 的尾数部分是 52 位,float 的尾数部分是 23 位,由于同时都带有一个固定隐含位(这个后面会说),所以 double 有 53 个二进制有效位,float 有 24 个二进制有效位,所以所以它们的精度在十进制中分别是 log10(2^53) 约等于 15.95 和 log10(2^24) 约等于 7.22 位,因此 double 的有效数字是 15~16 位,float 的有效数字是 7~8 位,这些有效位是包含整数部分和小数部分;
(2).double 的指数部分是 11 位,而 float 的指数位是 8 位,意味着 double 相比 float 能表示更大的数值范围;

那二进制小数,是如何转换成二进制浮点数的呢?
我们就以 10.625 作为例子,看看这个数字在 float 里是如何存储的。
在这里插入图片描述

首先,我们计算出 10.625 的二进制小数为 1010.101。

然后把小数点,移动到第一个有效数字后面,即将 1010.101 右移 3 位成 1.010101,右移 3 位就代表 +3,左移 3 位就是 -3。

float 中的「指数位」就跟这里移动的位数有关系,把移动的位数再加上「偏移量」,float 的话偏移量是 127,相加后就是指数位的值了,即指数位这 8 位存的是 10000010(十进制 130),因此你可以认为「指数位」相当于指明了小数点在数据中的位置。

1.010101 这个数的小数点右侧的数字就是 float 里的「尾数位」,由于尾数位是 23 位,则后面要补充 0,所以最终尾数位存储的数字是 01010100000000000000000。

在算指数的时候,你可能会有疑问为什么要加上偏移量呢?

前面也提到,指数可能是正数,也可能是负数,即指数是有符号的整数,而有符号整数的计算是比无符号整数麻烦的,所以为了减少不必要的麻烦,在实际存储指数的时候,需要把指数转换成无符号整数。

float 的指数部分是 8 位,IEEE 标准规定单精度浮点的指数取值范围是 -126 ~ +127,于是为了把指数转换成无符号整数,就要加个偏移量,比如 float 的指数偏移量是 127,这样指数就不会出现负数了。

细心的朋友肯定发现,移动后的小数点左侧的有效位(即 1)消失了,它并没有存储到 float 里。

这是因为 IEEE 标准规定,二进制浮点数的小数点左侧只能有 1 位,并且还只能是 1,既然这一位永远都是 1,那就可以不用存起来了。

于是就让 23 位尾数只存储小数部分,然后在计算时会自动把这个 1 加上,这样就可以节约 1 位的空间,尾数就能多存一位小数,相应的精度就更高了一点。

那么,对于我们在从 float 的二进制浮点数转换成十进制时,要考虑到这个隐含的 1,转换公式如下:
在这里插入图片描述
举个例子,我们把下图这个 float 的数据转换成十进制,过程如下:
在这里插入图片描述

4.浮点数精度:0.1 + 0.2 == 0.3 ?
在这里插入图片描述
在这里插入图片描述
这两个结果相加就是 0.300000004470348358154296875:
在这里插入图片描述
所以,你会看到在计算机中 0.1 + 0.2 并不等于完整的 0.3

这主要是因为有的小数无法可以用「完整」的二进制来表示,所以计算机里只能采用近似数的方式来保存,那两个近似数相加,得到的必然也是一个近似数。

而我们二进制只能精准表达 2 除尽的数字 1/2, 1/4, 1/8,但是对于 0.1(1/10) 和 0.2(1/5),在二进制中都无法精准表示时,需要根据精度舍入。

我们人类熟悉的十进制运算系统,可以精准表达 2 和 5 除尽的数字,例如 1/2, 1/4, 1/5(0.2), 1/8, 1/10(0.1)。

当然,十进制也有无法除尽的地方,例如 1/3, 1/7,也需要根据精度舍入。

在这里插入图片描述

当E中全部为二进制1时,因为IEEE 标准规定单精度浮点的指数取值范围是 -126 ~ +127,此时计算出来255 - 127 = 128超出范围了。所以,此时:
(1).当尾数部分部分不全为0时,表示NaN。表示浮点数不存在。
(2).当尾数部分全为0时,表示正无穷(符号位为0)或者负无穷(符号位为1)。

当E中全部为二进制0时,因为IEEE 标准规定单精度浮点的指数取值范围是 -126 ~ +127,此时计算出来0 - 127 = -127超出范围了。所以,此时:
数值为: ( − 1 ) 符号位 ∗ ( 0 + 尾数位 ) ∗ 2 − 127 (-1)^{符号位}*(0+尾数位)*2^{-127} (1)符号位(0+尾数位)2127

1.从int转成float,数字不会溢出,但可能被舍入。
2.从int或float转成double,可保留精确数值
3.从double换成float,可能溢出为正无穷,负无穷。可能被舍入。
4.从float或double转成int,可能会溢出。值将向0舍入。
溢出体现在超出表示范围,舍入体现在稠密映射到稀疏下,无法精确的一一映射,但可映射到最接近的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/194700.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

VS2022 配置Qt编译环境 | winows安装Qt5.14.2 | VS2017和Qt5配置成功指南

Visual Studio 2022安装教程完文本内容较多,请耐心看完,挺有收获的,要自己多尝试哦。 文章目录 # 插件安装 如果你想用VS2022来创建QT项目,那么你首先要学会下面的操作,创建一个空白解决方案,在扩展搜索qt,并且下载两个插件(带有绿√的就是)。这里其实是一个坑:VS20…

万宾科技第四代可燃气体监测仪的作用

燃气作为一种重要的能源已在居民生活、工业生产和商业活动等领域得到了广泛的应用。但是与之而来的便是各种各样的燃气管网的安全问题,其中燃气管网泄漏成为了城市生命线建设中亟待解决的安全隐患。因此采取切实有效的措施来保障燃气管网的安全运行,应用…

NB-IoT BC260Y Open CPU SDK④开发环境搭建

NB-IoT BC260Y Open CPU SDK④开发环境搭建 1、SDK包的介绍2、编程工具3、程序框架1、SDK包的介绍 (1)、SDK包的下载: 链接: (2)、文件目录介绍 文件名描述device启动文件、底层配置文档等doc存放 QuecOpen 项目相关的说明文档osFreeRTOS 相关代码out输出编译 App 和调…

【Python】遍历电脑中的所有文件

通过os模块中的os.walk()遍历电脑指定路径的所有文件及大小: import osdef traverse_files(path):file_path_list[]file_size_list[]for root, dirs, files in os.walk(path):for file in files:file_path os.path.join(root, file)file_path_list.append(file_pa…

最新版小权云黑系统 骗子添加查询源码

小权云黑系统添加骗子,查询骗子,可添加团队后台方便审核用,在线反馈留言系统,前台提交骗子,后台需要审核才能过,后台使用光年UI界面,新增导航列表,可给网站添加导航友链,…

爬虫系统Docker和Kubernetes部署运维最佳实践

在构建和管理爬虫系统时,使用Docker和Kubernetes可以带来诸多好处,如方便的部署、弹性伸缩和高可靠性。然而,正确的部署和运维实践对于确保系统稳定运行至关重要。在本文中,我将分享爬虫系统在Docker和Kubernetes上的最佳部署和运…

2020年09月 Scratch图形化(四级)真题解析#中国电子学会#全国青少年软件编程等级考试

Scratch等级考试(1~4级)全部真题・点这里 一、单选题(共15题,每题2分,共30分) 第1题 执行下面程序,输入4和7后,角色说出的内容是? A:4,7 B:7,7 C:7,4 D:4,4 答案:B 第2题 执行下面程序,输出是? A:大学 中庸 孟子 论语 B:论语 大学 孟子 中庸 C:大…

Unity中Shader的BRDF解析(一)

文章目录 前言现在我们主要来看Standard的 漫反射 和 镜面反射一、PBS的核心计算BRDF二、Standard的镜面高光颜色三、具体的BRDF计算对于BRDF的具体计算,在下篇文章中,继续解析 四、最终代码.cginc文件Shader文件 前言 在上篇文章中,我们解析…

Lasso回归

【小白从小学Python、C、Java】 【计算机等考500强证书考研】 【Python-数据分析】 Lasso回归 以下代码的说法中正确的是? import numpy as np import matplotlib.pyplot as plt x np.array([[1],[2],[3],[4]]) y np.array([1,3,6,10]) from sklearn.linear_model impor…

电脑热点无法使用,分配IP地址失败

电脑热点无法使用,分配IP地址失败 不知道从什么时候起电脑开热点就无法连接上了,手机提示无法分配IP地址,电脑正常显示。 设置共享网络连接时提示以下内容。 无法启用internet连接共享,为LAN连接配置的IP地址需要使用自动IP寻址 查阅相关资…

java编程:给定⼀组正整数数组M,找出M数组中N项和为给定数S。如果有多对N项数字的和都等于 S,则输出N个数的乘积最⼩的哪⼀项,没有则返回空

题目: 编程题:给定⼀组正整数数组M,找出M数组中N项和为给定数S。如果有多对N项数字的和都等于 S,则输出N个数的乘积最⼩的哪⼀项,没有则返回空; 程序如下: 测试主程序: 先看下测试示…

【操作宝典】SQL巨擘:掌握SQL Server Management的终极秘籍!

目录 ⛳️【SQL Server Management】 ⛳️1. 启动登录 ⛳️2. 忘记密码 ⛳️3. 操作数据库和表 3.1 新建数据库text 3.2 新建表 3.3 编辑表 3.4 编写脚本 ⛳️【SQL Server Management】 ⛳️1. 启动登录 需要开启服务 ⛳️2. 忘记密码 登录windows--> 安全性 -->…

Windows11安装后跳过联网登录

Windows11安装后跳过联网登录 实验设备: VMware17Pro虚拟机中使用Windows11镜像安装Windows11操作系统,并且在虚拟机中测试跳过联网登录。 步骤 说明:物理卸载网卡(在虚拟机上禁用网卡)没用 思路: sh…

计算机毕业设计springboot+vue高校田径运动会报名管理系统61s38

高校田径运动会管理采用java技术,基于springboot框架,mysql数据库进行开发,实现了首页、个人中心、运动员管理、裁判员管理、场地信息管理、项目类型管理、比赛项目管理、比赛报名管理、比赛成绩管理、通知公告管理、留言板管理、交流论坛、系…

北美区域性确定性预测系统平均温度数据

区域确定性预测系统(RDPS) 区域确定性预测系统 (RDPS) 进行物理计算,以 10.0 公里网格(1/11 度)空间分辨率对当天到未来 48 小时内的大气元素进行确定性预测。平均温度数据覆盖北美,由加拿大气象局 (MSC) …

GitHub 2023排名前十的最佳开源项目

开源软件(OSS)彻底改变了当今软件开发的方式。在数百万个开源GitHub项目中,要找到最适合需求的开源项目可能会让人不知所措。 今天给大家列出2023年增长最快的前10个开源GitHub仓库。通过这些增长最快的开源项目,也可以从整体上了…

Jboss启动报错Unrecognized VM option PermSize=128m

1.问题现象 JBoss启动提示创建JAVA虚拟机失败,异常信息如下 异常截图 异常日志 .JBoss Bootstrap Environment .JBOSS_HOME: E:\Jboss\jboss-4.0.2_BR_5.4.4.21\bin\\.. .JAVA: C:\Java\jdk1.6.0_38\bin\java .JAVA_OPTS: -Xms64m -Xmx1024m -Dprogram.namerun.ba…

vue3中toRaw 与 markRaw

toRaw 返回由 reactive 或 readonly 方法转换成响应式代理的普通对象。 这是一个还原方法,可用于临时读取,访问不会被代理/跟踪,写入时也不会触发界面更新。 markRaw 标记一个对象,使其永远不会转换为代理。返回对象本身 应…

数据结构 | 排序

插入排序 直接插入排序(空间复杂度为1,排序后稳定) 思路: 在待排序的元素中,假设前n-1个元素已有序,现将第n个元素插入到前面已经排好的序列中,使得前n个元素有序。按照此法对所有元素进行插入&…

NX二次开发UF_MTX3_copy 函数介绍

文章作者:里海 来源网站:https://blog.csdn.net/WangPaiFeiXingYuan UF_MTX3_copy Defined in: uf_mtx.h void UF_MTX3_copy(const double mtx_src [ 9 ] , double mtx_dst [ 9 ] ) overview 概述 Copies the matrix elements from a source 3x3 mat…