机器语言编写helloworld

kvmtool下载编译

git clone https://github.com/kvmtool/kvmtool.git 下载后进入到目录执行make即可。

补码

计算机怎么表示负数？以四位有符号数为例，使用高位作为符号位，最高位为0表示正数，为1表示负数，其余三位用来表示值。在计算机中，我们将这种表示方式称为原码。例如：

十进制	二进制	十进制	二进制
2	0010	-2	1010

使用原码表示时，数字0有两种编码：0000和1000。因此，如果使用原码，在设计系统时就需要额外的电路区分+0和-0更糟糕的是如果一个数的正数相加应为0，2 - 2为例：2 - 2 = 2 + (-2) = 0010 + 1010 = 1100 = -4 这明显不对，也就是说，原码不能正确计算减法。怎么办呢？聪明的人类发现使用补码表示数字就可以加减法了。

即：正数的反码和补码都是原码，负数的反码是除符号位以外按位取反，补码是在反码基础上+1。使用补码重新计算 2 - 2：2 + (-2) = 0010 + 1110 = 0000

ASCII码

计算机用高低电平分别表示0和1，所有的数据在存储和运算时都要使用二进制表示，如果我们想用数字表示文本，就要对每一个文本进行编码，目的就是文本转换成数值。具体用哪些二进制是数字表示哪个符号，美国国家标准协会制定了美国信息交换标准代码(American Standard Code for Information Interchange)简称ASCII。ASCII使用8位编码，最多可以表示256个字符，hello world使用的编码就是为：68 65 6C 6C 6F 77 6F 72 6C 64

写外设指令

操作码	指令	描述
EE	out DX,AL	将寄存器AL中的字节输出到寄存器DX中的I/O端口地址

第一列为操作码，第二列为汇编语法描述的指令，第三列是指令意义的详细描述。从描述中我们可以得到，EE操作码它会自动到寄存器AX中读取源操作数，到寄存器DX中读取目的操作数。out为操作码的助记符，AL为8位寄存器，DX是16位寄存器，ASCII码是8位的，串口的地址0x3F8（IBM计算机外设地址）是需要使用16位的表示的。

根据写串口指令的格式，我们的程序流程细化为：在执行EE命令前，将串口地址0x3F8存入寄存器DX，将字符存入寄存器AL。

准备源操作数

由out指令可见，在运行指令之前需要将字符A存储到寄存器AL中。x86提供了数据复制指令mov，用于将数据从原操作数复制到目的操作数。原操作数是一个8位立即数，目的操作数是r8，表示一个8位寄存器。

操作码	指令	描述
B0+rb	mov r8,imm8	将一个8位立即数复制到一个8位寄存器

指令编码为（B0+rb）ib。根据x86手册，其中rb表示使用操作码的低三位编码目的操作数，即将目的操作寄存器r8的编码嵌入操作吗的低三位。寄存器AL对应的编码为0，因此B0+rb最终编码为B0。

指令编码中的ib对应原操作数，其中i表示立即数，b表示立即数的宽度是一个字节。所以，ib表示跟在操作码之后的是一个8位立即数，和字符对应的ASCII码组合最终（B0+rb）ib的编码分别为：B068 B065 B06C B06C B06F B077 B06F B072 B06C B064。

准备目的操作数

我们需要将串口地址写到寄存器DX中，实质是将一个16位立即数复制到一个16位寄存器，这显然还是一个数据复制操作

操作码	指令	描述
B8+rw	mov r16,imm16	将一个16位立即数复制到一个16位寄存器

这个格式mov指令也接受两个操作数，只不过是16位的。指令编码中的rw表示使用操作码的低三位编码目的操作数，即将目的操作寄存器r16的编码嵌入操作码的低三位。根据x86手册，寄存器DX对应的编码为2，因此B8+rw编码为BA。

指令编码的iw中的i表示立即数，w表示立即数的宽度是一个字，即两个字节。所以iw表示跟在操作码之后的是一个16位立即数，这里即串口地址。不过x86处理器使用小端模式，所以最终（B8+rw）iw的编码为BAF803。

跳转指令

我们的程序循环向串口输出字符串helloworld，在向串口输出后，需要跳转到程序开始的位置，因此需要一个跳转指令jmp，格式如下。

操作码	指令	描述
EB cb	jmp rel8	跳转到指令指针+rel8的位置

jmp指令后接一个rel8。rel是relative的缩写，表示相对的意思，8代表8位，因此可以跳转到相对这条指令-128~127的范围。在指令编码中操作码EB之后“cb”就是这个8位的相对偏移。

如果我们想让指令指针指向程序开头，即B0所在的内存地址，那么jmp需要向后跳转35个字节。因为是向后跳转，所以是-35，又因为计算机中使用的是补码，所以我们需要转换一下，根据原码转补码的规则-35的原码是10100011，补码就为11011101，使用16进制表示，即DD。

至此，我们就完成了这段程序的机器语言编码：

ba f8 03
b0 68
ee
b0 65
ee
b0 6c
ee
b0 6c
ee
b0 6f
ee
b0 77
ee
b0 6f
ee
b0 72
ee
b0 6c
ee
b0 64
ee
eb dd

创建程序文件

我们使用vim以二进制模式打开一个文件，vim -b hello_world.bin。按i进入插入模式，然后输入我们的代码
。输入完成后，按下ESC返回标准模式。在标准模式下按下“:”键，进入命令行模式。在“:”的后面输入将16进制转为二进制命令：

:%! xxd -p -r

"%"表示整个文件内容，”%!“一起使用表示将整个文件内容作为后面xxd的输入，然后使用xxd从16进制转为二进制的输出替换整个文件内容。-p 表示不需要任何格式，-r意为反过来。最后输入：“wq”保存退出

使用kvmtool运行程序

sudo kvmtool/lkvm run -c 1 -k hello_world.bin

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/505676.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！