解码新时代内存架构:探秘数据在内存中的灵动驻足

欢迎来到白刘的领域   Miracle_86.-CSDN博客

系列专栏  C语言知识

先赞后看,已成习惯

   创作不易,多多支持!

随着信息技术的飞速发展,我们身处一个数据爆炸的时代。数据的处理和存储方式正日益成为技术革新的重要领域。在新时代的内存架构中,数据的灵动驻足,正为计算世界注入无限活力。今天我们就来简单探讨一下数据在内存中的存储。

目录

一、整数在内存中的存储

二、大小端字节序和字节序判断

2.1 什么是大小端

2.2 为什么要有大小端

2.3 练习

练习1

 练习2

练习3

三、浮点数在内存中的存储

3.1 浮点数存的过程

3.2 浮点数取的过程

3.3 题目解析


一、整数在内存中的存储

前面在讲解操作符的时候,我们就提到了原码、反码、补码。这三个是整数的二进制的三种表示方法。

 武器大师——操作符详解(上)-CSDN博客

三种表示方法均有符号位数值位两部分,符号位都是由“ 0 ”表示“ 正 ”,“ 1 ”表示“ 负 ”,而数值位的最高一位被当做符号位,其余的都是数值位。

正整数的原、反、补码都相同。

负整数则各不相同,需要运算:

原码:直接将数值按照正负数的形式翻译成二进制得到的就是原码。

反码:原码的符号位不变,其它位都取反(也就是0变成1,1变成0)。

补码:就是在反码的基础上+1。

而对于整型来讲:数据在内存中存放的其实是补码。

为什么呢?

在计算机系统中,数值⼀律⽤补码来表⽰和存储。
原因在于,使⽤补码,可以将符号位和数值域统⼀处理;
同时,加法和减法也可以统⼀处理(CPU只有加法器)此外,补码与原码相互转换,其运算过程是相同的,不需要额外的硬件电路。 

二、大小端字节序和字节序判断

当我们了解完整数在内存中的存储后,我们调试看会发现一个细节:

#include <stdio.h>
int main()
{
	int a = 0x11223344;

	return 0;
}

调试的时候我们可以看到a中的0x11223344这个数字是以字节为单位,倒着存储的。那它为什么不是正着存储的呢?

2.1 什么是大小端

其实超过一个字节的数据在内存中存储的时候,不可避免出现存储顺序的问题,按照不同的存储顺序,我们分为大端字节序和小端字节序。

大端(存储)模式:是指数据的字节内容保存在地址处,而数据的字节内容保存到地址处。

小端(存储)模式:是指数据的字节内容保存在地址处,而数据的字节内容保存到地址处。

2.2 为什么要有大小端

在计算机系统中,内存的基本组织单位是字节,每个内存地址单元都对应一个字节,即8位。然而,在编程语言如C语言中,除了8位的char类型外,还存在其他位宽的数据类型,如16位的short型和32位的long型(具体位宽可能因编译器而异)。

当使用位数大于8位的处理器,比如16位或32位处理器时,由于它们的寄存器宽度超过一个字节,这就涉及到了如何将多个字节组合在一起存储的问题。这种多字节数据的存储顺序问题导致了两种不同的字节序模式:大端字节序和小端字节序。

以16位的short型变量x为例,假设其在内存中的起始地址为0x0010,并且x的值为0x1122。在这里,0x11是高位字节,0x22是低位字节。如果采用大端字节序,高位字节0x11会被存放在较低的地址0x0010中,而低位字节0x22则存放在较高的地址0x0011中。相反,如果采用小端字节序,存储顺序则正好相反。

在我们常见的X86架构中,采用的是小端字节序。然而,不同的处理器架构或编程环境可能有不同的选择。例如,KEIL C51通常使用大端字节序,而许多ARM和DSP处理器则采用小端字节序。甚至有些ARM处理器允许通过硬件配置来选择使用大端字节序还是小端字节序。

2.3 练习

练习1

设计一个程序来判断当前机器的字节序。(10分)——百度笔试题。

//代码1
#include <stdio.h>
int check_sys()
{
	int i = 1;
	return (*(char*)&i);
}
int main()
{
	int ret = check_sys();
	if (ret == 1)
	{
		printf("⼩端\n");
	}
	else
	{
		printf("⼤端\n");
	}
	return 0;
}

思路:我们知道整型1的原码是0x00 00 00 01(仅写8位做示例),如果按照小端字节序,它存放的应该是01 00 00 00;如果是大端则是00 00 00 01。那我们只需要判断第一个字节是00还是01即可,所以我们用到了强制类型转换,将其转换成char*。

//代码2
int check_sys()
{
	union
	{
		int i;
		char c;
	}un;
	un.i = 1;
	return un.c;
}

 第二种方法则用到了联合体,这段先放着,我们以后再来讲(继续挖坑ing)。

 练习2
#include <stdio.h>
int main()
{
	char a = -1;
	signed char b = -1;
	unsigned char c = -1;
	printf("a=%d,b=%d,c=%d", a, b, c);
	return 0;
}

这里先说一下什么是signed char以及unsigned char,正常的char我们都知道,存放一个字节,也就是8个比特位,而signed char是有符号字符型,说明它的最高位被当成了符号位,而unsigned char就是无符号的,那接下来就可以计算了。

//对于a:

//首先写出-1的原码   10000000 00000000 00000000 00000001
//反码              11111111 11111111 11111111 11111110
//补码              11111111 11111111 11111111 11111111
//由于a为char 所以只能存储一个字节,所以存储的为11111111
//继续计算,补码变成原码,取反+1,              10000001
//所以输出-1。

//对于b,和a同理

//对于c,因为它是无符号的,所以存储的为10000001,直接换算为255

来看运行结果:

练习3
#include <stdio.h>
int main()
{
	char a = -128;
	printf("%u\n", a);
	return 0;
}

如果想知道这题如何做,我们首先要知道%u是什么,它的意思是认为a中存放的是无符号整数。由于a为char类型,所以我们首先要进行整型提升。

//原码 10000000 00000000 00000000 10000000
//反码 11111111 11111111 11111111 01111111
//补码 11111111 11111111 11111111 10000000

//由于%u,所以打印出来一个很大的数

 运行结果:

三、浮点数在内存中的存储

常见的浮点数:3.14159、1E10...浮点数家族包括:float、double、long double类型。

浮点数的范围:在<float.h>中定义。

#include <stdio.h>
int main()
{
	int n = 9;
	float* pFloat = (float*)&n;
	printf("n的值为:%d\n", n);
	printf("*pFloat的值为:%f\n", *pFloat);
	*pFloat = 9.0;
	printf("num的值为:%d\n", n);
	printf("*pFloat的值为:%f\n", *pFloat);
	return 0;
}

来看运行结果:

上述代码的n和*pFloat明明存储的是一样的值为什么两次*pFloat的值不一样呢?

要理解这个结果的话,我们需要搞懂浮点数在计算机内部的存储方法。

3.1 浮点数存的过程

根据国际标准IEEE(电气和电子工程协会)754,任意一个二进制浮点数V可以表示成下面的形式:V=\left ( -1 \right )^{S}\ast M\ast 2^{E}(其中\left ( -1 \right )^{S}代表符号位,M代表有效数字,2^{E}代表指数位)。

举个例子:

十进制的5.0,写成二进制是101.0,相当于1.01*2²,S=0,M=1.01,E=2。

十进制的-5.0,写成二进制是-101.0,相当于-1.01*2²,S=1,M=1.01,E=2。

IEEE 754规定:

对于32位的浮点数,最高1位存储符号位S,之后的8位存储指数E,剩下的23位存储有效数字M;

对于64位的浮点数,最高1位存储符号位S,之后的11位存储指数E,剩下的23位存储有效数字M。

IEEE 754对M和E还有一些特殊规定。

前面说过,1≤M<2,也就是说M可以写成1.xxxxxxxxx,其中xxxxxxxxx是小数部分。

IEEE 754规定,在计算机内部保存M时,默认这个数的第一位是1,因此可以被舍去,只保存后面的小数部分。比如保存1.01时,只保存后面的01,等到读取的时候,再把前面的1加上,这样做的目的,是可以节省1位有效数字。以32位浮点数为例,留给M的只有23位,将1舍去后,就可以保留24位。

而至于指数E,情况就比较复杂了。

首先E是一个无符号整数(unsigned int)。

这意味着,如果E为8位,它的取值范围为0~255;如果E为11位,它的取值范围为0~2047。但是,我们知道,科学计数法中的E是可以出现负数的,所以IEEE 754规定,存⼊内存时E的真实值必须再加上⼀个中间数,对于8位的E,这个中间数是127;对于11位的E,这个中间数是1023。⽐如,2^10的E是10,所以保存成32位浮点数时,必须保存成10+127=137,即10001001。

3.2 浮点数取的过程

E从内存中取出还可以分为三种情况:

E不全为0或不全为1

这时,浮点数就采⽤下⾯的规则表⽰,即指数E的计算值减去127(或1023),得到真实值,再将有效数字M前加上第⼀位的1。
⽐如:0.5 的⼆进制形式为0.1,由于规定正数部分必须为1,即将小数点右移1位,则为1.0*2^(-1),其阶码为-1+127(中间值)=126,表⽰为01111110,⽽尾数1.0去掉整数部分为0,补⻬0到23位00000000000000000000000,则其⼆进制表⽰形式为:

0 01111110 00000000000000000000000

E全为0

这时,浮点数的指数E等于1-127(或者1-1023)即为真实值,有效数字M不再加上第⼀位的1,⽽是还原为0.xxxxxx的小数。这样做是为了表⽰±0,以及接近于0的很小的数字。

0 00000000 00100000000000000000000

E全为1

这时,如果有效数字M全为0,表⽰±⽆穷⼤(正负取决于符号位s)。

0 11111111 00010000000000000000000

3.3 题目解析

之后我们再来回到题目

首先第一个问题,为什么9还原成浮点数,就变成了0.000000?

9以整型的形式存储在内存中,得到以下二进制序列:

0000 0000 0000 0000 0000 0000 0000 1001

我们按照刚刚我们讲的,将其拆分,得到,S=0,E=00000000,剩下的是M。

所以V=(-1)^0 × 0.00000000000000000001001×2^(-126)=1.001×2^(-146)

显然这是一个接近无穷小的一个数,保留即是0.000000。

再来看第二个问题,为什么浮点数9.0,整数打印是1091567616。

首先,9.0二进制为1001.0,即1.001*2³。

所以:9.0=(-1)º ×(1.001)×2³,

那么,第⼀位的符号位S=0,表示这是一个正数。有效数字M等于001后⾯再加20个0,凑满23位,即M的二进制10000010 

所以,写成⼆进制形式,应该是S+E+M,即

0 10000010 001 0000 0000 0000 0000 0000
这个32位的⼆进制数,被当做整数来解析的时候,就是整数在内存中的补码,原码正是
1091567616。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/484209.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【Java】高级篇2:多线程

一、相关概念 注意&#xff1a; 1、不同进程之间不共享内存 2、进程之间的数据交换和通信成本很高 线程调度&#xff1a; 单核CPU与多核CPU&#xff1a; 并行与并发&#xff1a; 二、创建和启动线程 1、概述 2、方式 2.1 方式一&#xff1a;继承Thread类 2.2 方式二&#xf…

Fantasy RPG Spell Pack 2

介绍奇幻角色扮演游戏魔法包VFX,这是为您的Unity奇幻角色扮演游戏提供的终极视觉效果解决方案!这个包包含30个独特的VFX,将为您的法术和能力带来生命,让您的玩家沉浸在魔法和奇迹的世界中。 从令人惊叹的彩虹盾和闪电到旋转门户和召唤圈,这个包有你需要的一切来创造一个真…

GETSHELL方法总结上

渗透的总步骤 1.信息收集找到弱漏洞 2.漏洞挖掘 漏洞验证 3.有一定权限 getshell 4.提权后---渗透 5.内网渗透】 前后台拿shell方法汇总 接下来我们实操一波dedecms也就是织梦cms 如果你们的靶场是空白的 可能是php版本 我们修改为5.2 可能是源码问题 我们不要急着上传…

ChatGPT论文指南|揭秘8大ChatGPT提示词研究技巧提升写作效率【建议收藏】

点击下方▼▼▼▼链接直达AIPaperPass &#xff01; AIPaperPass - AI论文写作指导平台 公众号原文▼▼▼▼&#xff1a; ChatGPT论文指南|揭秘8大ChatGPT提示词研究技巧提升写作效率【建议收藏】 目录 1.写作方法 2.方法设计 3.研究结果 4.讨论写作 5.总结结论 6.书…

MySQL--select count(*)、count(1)、count(列名) 的区别你知道吗?

MySQL select count(*)、count(1)、count(列名) 的区别&#xff1f; 这里我们先给出正确结论&#xff1a; count(*)&#xff0c;包含了所有的列&#xff0c;会计算所有的行数&#xff0c;在统计结果时候&#xff0c;不会忽略列值为空的情况。count(1)&#xff0c;忽略所有的列…

Axure RP 9 for mac中文版密钥激活版下载

Axure RP 9是一款专业的快速原型设计工具&#xff0c;它可以帮助产品设计师、交互设计师和用户体验设计师等创建高保真度、交互性强的原型&#xff0c;以便在产品开发之前进行测试和用户验证。 软件下载&#xff1a;Axure RP 9 for mac中文版密钥激活版下载 该工具具有丰富的功…

2023蓝桥杯C/C++A组省赛 B题: 有奖问答|DFS搜索 、线性dp

题目链接&#xff1a; 1.有奖问答 - 蓝桥云课 (lanqiao.cn) 说明&#xff1a; DFS做法&#xff1a; 因为是填空题&#xff0c;不用考虑超时&#xff0c;首先先考虑暴力做法DFS来做&#xff0c;根据题意&#xff0c;30道题&#xff0c;有一个答题的先后顺序&#xff0c;上一…

【算法篇】逐步理解动态规划1(斐波那契数列模型)

目录 斐波那契数列模型 1. 第N个泰波那契数 2.使用最小花费爬楼梯 3.解码方法 学过算法的应该知道&#xff0c;动态规划一直都是一个非常难的模块&#xff0c;无论是状态转移方程的定义还是dp表的填表&#xff0c;都非常难找到思路。在这个算法的支线专题中我会结合很多力…

Java学习笔记 | Java基础语法 | 03 | 流程控制语句

文章目录 0 前言1.流程控制语句1.1 流程控制语句分类1.2 顺序结构 2.判断语句2.1 if语句1. if语句格式1练习1&#xff1a;老丈人选女婿练习2&#xff1a;考试奖励 2. if语句格式2练习1&#xff1a;吃饭练习2&#xff1a;影院选座 3. if语句格式3练习1&#xff1a;考试奖励 2.2 …

Vue使用font-face自定义字体详解

目录 1 介绍2 使用2.1 语法2.2 属性说明2.3 Vue使用案例2.3.1 全局定义字体2.3.2 在页面使用 3 注意事项 1 介绍 font-face 是 CSS 中的一个规则&#xff0c;它允许你加载服务器上的字体文件&#xff08;远程或者本地&#xff09;&#xff0c;并在网页中使用这些字体。这样&am…

使用 STL 容器发生异常的常见原因分析与总结

目录 1、概述 2、使用STL列表中的元素越界 3、遍历STL列表删除元素时对迭代器自加处理有问题引发越界 4、更隐蔽的遍历STL列表删除元素时引发越界的场景 5、多线程同时操作STL列表时没有加锁导致冲突 6、对包含STL列表对象的结构体进行memset操作导致STL列表对象内存出异…

大学教材《C语言程序设计》(浙大版)课后习题解析 | 第一、二章

概述 本文主要提供《C语言程序设计》(浙大版) 第一、二章课后习题解析&#xff0c;以方便同学们完成题目后作为参考对照。后续将写出三、四章节课后习题解析&#xff0c;如想了解更多&#xff0c;请持续关注该专栏。 专栏直达链接&#xff1a;《C语言程序设计》(浙大版)_孟俊宇…

Hive SQL必刷练习题:复购率问题(*****)

是说这个数据表中&#xff0c;找到最后一天 &#xff0c;也就是今天的日期&#xff0c;max(date) over()S today 【借助开窗函数】 截至最后一天位置&#xff0c;也就是“今天“&#xff0c;表中的最新的一天 去看90天内“某商品复购率 近90天内购买它至少两次的人数 购买它…

c++常考基础知识(2)

二.c关键字 关键字汇总 c中共有63个关键字&#xff0c;其中包括int&#xff0c;char&#xff0c;double等类型关键字&#xff0c;if&#xff0c;else&#xff0c;while&#xff0c;do&#xff0c;等语法关键字&#xff0c;还有sizeof等函数关键字。 三.数据结构 1.数组&#x…

常见的OOM 问题的 6 种场景

今天跟大家一起聊聊线上服务出现 OOM 问题的 6 种场景,希望对你会有所帮助。 一、堆内存 OOM 堆内存 OOM 是最常见的 OOM 了。 出现堆内存 OOM 问题的异常信息如下: java.lang.OutOfMemoryError: Java heap space此 OOM 是由于 JVM 中 heap 的最大值,已经不能满足需求了…

Git的原理和使用(四)

目录 远程操作 理解分布式版本控制系统 远程仓库 新建远程仓库 克隆远程仓库 向远程仓库推送 拉取远程仓库 配置Git 忽略特殊文件 为命令配置别名 标签管理 理解标签 创建标签 操作标签 远程操作 理解分布式版本控制系统 1、每个人的电脑上都是一个完整的版本库…

批量重命名文件名,批量管理文件,复制后轻松删除原文件

在现代工作中&#xff0c;我们经常需要处理大量的文件&#xff0c;无论是工作文档、图片还是视频资料。对于很多人来说&#xff0c;文件管理是一项繁琐且耗时的任务。不过&#xff0c;现在有一种高效的文件管理方法&#xff0c;可以帮助你轻松复制文件后删除原文件夹&#xff0…

2024.03.24 exam

2024.03.24 exam 据说是事业单位考试例题&#xff0c;娱乐一下脑子

zabbix安装及使用(错误及解决方案)

安装zabbix 常见错误&#xff1a; Zabbix下载错误 6.0与5.0版本冲突 解决方法 yum -y install zabbix-server-mysql zabbix-web-mysql zabbix-get --skip-broken zabbix6.0-web 自己有数据库&#xff0c;使用以下命令 pid找不到 /var/log/zabbix/zabbix_server.log 错误&a…

Docker Command

小试牛刀 # 查看docker版本 docker -v docker --version # 查看帮助 docker --help # 永远的Hello World docker run hello-world镜像操作 查看本地已有的镜像 docker images -a :列出本地所有的镜像&#xff08;含中间映像层&#xff09; -q :只显示镜像ID --digests :显示…