30天开发操作系统 第 10 天 -- 叠加处理

前言

得益于昨天的努力,我们终于可以进行内存管理了。不过仔细一看会注意到,bootpack.c都已经有254行了。笔者感觉这段程序太长了,决定整理一下,分出一部分到memory.c中去。(整理中)…好了,整理完了。现在bootpack.c变成95行了。
为了以后使用起来更加方便,我们还是把这些内存管理函数再整理一下。memman_alloc和
memman_fee能够以1字节为单位进行内存管理,这种方式虽然不错,但是有一点不足–在反
复进行内存分配和内存释放之后,内存中就会出现很多不连续的小段未使用空间,这样就会把man->fees消耗殆尽。
因此,我们要编写一些总是以0x1000字节为单位进行内存分配和释放的函数,它们会把指定的内存大小按0x1000字节为单位向上舍入(roundup),而之所以要以0x1000字节为单位,是因为觉得这个数比较规整。另外,0x1000字节的大小正好是4KB。


一、内存管理3.0

unsigned int memman_alloc_4k(struct MEMMAN *man, unsigned int size)
{
	unsigned int a;
	size = (size + 0xfff) & 0xfffff000;
	a = memman_alloc(man, size);
	return a;
}

下面我们来看看这次增加的部分,这里的关键是向上舍人,可是如果上来就讲向上舍人的话可能不太好懂,所以我们还是先从向下舍人(round down)讲起吧。
讲数字问题时,以钱为例大家可能更容易理解,所以我们就用钱来举例说明。比如,把123元以10元为单位进行向下舍人,就是120元;把456元以100元为单位进行向下舍人,就是400元。
通过这些例子,你会发现“所谓向下舍人,就是把最后几位数字强制变为0”。所以如果将0x12345678以0x1000为单位进行向下舍人,得到的就应该是0x12345000吧?没错,这就是正确答案。这样一来,用纸笔就可以进行向下舍人运算了。不过,如果我们要写个程序让电脑来做同样的事,那该怎么办才好呢?
在二进制下,如果我们想把某位变为0,只要进行“与运算”就可以了,这在4.2节已经介绍过了。而十六进制其实就是把二进制数4位4位地排在一起,所以要想把十六进制的某一位设置为0,同样只进行“与运算”就可以。

0x12345678 &0xE0000x12345000
因此把变量i中的数字以0x1000为单位进行向下舍人的式子如下:
i = i & 0xfffff000:
顺便告诉大家一下,以0x10为单位向下舍人的式子是“i=i & 0xfffffff0;”。这样我们就掌握了向下舍人的方法。

下面我们来看看向上舍人。如果把123元以10元为单位进行向上舍人,就是130元;把456元以100元为单位进行向上舍人,就是500元。,原来如此,看来先向下舍入,再在它的结果上做个加法运算就可以了。
以0x1000为单位对0x12345678进行向上舍人的结果为0x12346000。所以有人可能会问:“要是用程序来表达这个过程的话就应该写成这样吧?
i = (i & 0xfffff000)+0x1000;
看起来貌似确实不错,但其实这并不是正确答案。因为如果“i=0x12345000;”时执行上述命令,结果就变成了“i=0x12346000;”。这当然不对啦。这就相当于,以10元为单位对120元进行向上舍人,结果为130元,但实际上120元向上舍人后应该还是120元。
所以我们要对程序进行改进。具体做法是:先判断最后几位,如果本来就是零则什么也不做,如果不是零就进行下面的运算。
if((i & 0xfff)!=0){(i & 0xfffff000)+ 0x1000;}
这样问题就解决了。大功告成。

现在我们可以灵活自由地进行向下舍入和向上舍人了,而实际上向上舍人还有改进的“窍门”
那就是:
i = (i + 0xfff)& 0xfffff000:
这是怎么回事呢?实际上这是“加上0x后进行向下舍人”的运算。不论最后几位是什么都可以用这个公式进行向上舍人运算。真的吗?
由于十六进制不易理解,所以我们还是以钱的十进制运算为例来说明吧。如使用这个方法以100元为单位对456元进行向上舍人,就相当于先加上99元再进行向下舍人。456元加上99元是555元,向下舍人后就是500元了。,这方法做出来的答案没错,456元向上舍人的结果确实就是500元。
那么如果对400元进行向上舍入呢?先加上99元,得到499元,再进行向下舍人,结果是400元。看,400元向上舍人的结果还是400元。
这种方法多方便呀,可比if语句什么的好用多了。不过其中的原理是什么呢?其实加上99元就是判断进位,如果最后两位不是00,就要向前进一位,只有当最后两位是00时,才不需要进位。接下来再向下舍人,这样就正好把因为加法运算而改变的后两位设置成00了。看,向上舍人就成功了哦。
那么试着“makern”一下吧。可是没有任何反应呀!那当然了,这次做的新函数,还没有被调用呢。

二、叠加处理

上一节我们为了转换心情,做了内存管理的探讨,现在还是回过头来,继续解决鼠标的问题吧。从各方面深入思考鼠标的叠加处理确实很有意思,不过考虑到今后我们还面临着窗口的叠加处理问题,所以笔者想做这么一段程序,让它不仅适用于鼠标的叠加处理,也能直接适用于窗口的叠加处理。
其实在画面上进行叠加显示,类似于将绘制了图案的透明图层叠加在一起。给大家看一下手机中的图层合成,这样大家更容易理解一些。
在这里插入图片描述
对应电脑的话最上面的小图层用来描绘鼠标指针,它下面的几张图层是用来存放窗口的,而最下面的一张图层用来存放桌面壁纸。同时,我们还要通过移动图层的方法实现鼠标指针的移动以及窗口的移动。
我们想法已经有了,下面就把它们变成程序吧。首先来考虑如何将一个图层的信息编成程序。

struct SHEET{
	unsigned char *buf;
	int bxsize,bysize,vx0,vy0,col_inv,height,flags;
};

暂时先写成这样就可以了。程序里的sheet这个词,表示“透明图层”的意思。英文里没有和“透明图层"接近的词,就凭感觉选了它。buf是用来记录图层上所描画内容的地址( buffer的略语 )。图层的整体大小,用bxsize*bysize表示。vx0和vy0是表示图层在画面上位置的坐标,v
是VRAM的略语。col_inv表示透明色色号,它是color(颜色)和invisible(透明)的组合略语。
height表示图层高度。Flags用于存放有关图层的各种设定信息。
只有一个图层是不能实现叠加处理的,所以下面我们来创建一个管理多重图层信息的结构。

#define MAX SHEETS 256
struct SHTCTL(
	unsigned char *vram;
	int xsize,ysize,top;
	struct SHEET *sheets[MAX SHEETS];
	struct SHEET sheets0[MAX SHEETS];
}

1.引入库

代码如下(示例):

#define MAX SHEETS 256
struct SHICTL(
	unsigned char *vram;
	int xsize,ysize,top;
	struct SHEET *sheets[MAX SHEETS];
	struct SHEET sheets0[MAX SHEETS];
}

我们创建了SHTCTL结构体,其名称来源于sheet control的略语,意思是“图层管理”。
MAX SHEETS是能够管理的最大图层数,这个值设为256应该够用了
变量vram、xsize、ysize代表VRAM的地址和画面的大小,但如果每次都从BOOTINFO查询的话就太麻烦了,所以在这里预先对它们进行赋值操作。top代表最上面图层的高度。sheets0这个结构体用于存放我们准备的256个图层的信息。而sheets是记忆地址变量的领域,所以相应地也要先准备256份。这是干什么用呢?由于sheets0中的图层顺序混乱,所以我们把它们按照高度进行升序排列,然后将其地址写入sheets中,这样就方便多了。
不知不觉我们已经写了很多了,不过也许个别地方大家还不太明白,与其在这纸上谈兵,不如直接看程序更易于理解。所以前面的说明部分,大家即使不懂也别太在意,先往下看吧。heihei我们提到的图层控制变量中,仅仅sheets0的部分大小就有32x256-8192,即8KB,如果再加上sheets的话,就超过了9KB。对于空间需要如此大的变量,我们想赶紧使用memman_alloc_4k来分配内存空间,所以就编写了对内存进行分配和初始化的函数。

struct SHTCTL *shtctl_init(struct MEMMAN *memman, unsigned char *vram, int xsize, int ysize)
{
	struct SHTCTL *ctl;
	int i;
	ctl = (struct SHTCTL *) memman_alloc_4k(memman, sizeof (struct SHTCTL));
	if (ctl == 0) {
		goto err;
	}
	ctl->vram = vram;
	ctl->xsize = xsize;
	ctl->ysize = ysize;
	ctl->top = -1; /* 一个SHEET都没 */
	for (i = 0; i < MAX_SHEETS; i++) {
		ctl->sheets0[i].flags = 0; /* 未使用标记 */
	}
err:
	return ctl;
}

这段程序是什么的呢?首先使用memman_alloc_4k来分配用于记忆图层控制变量的内存空间,这时必须指定该变量所占空间的大小,不过我们可以使用sizeof(stuctSHTCTL)这种写法让C编译器自动计算。只要写sizeof(变量型),C编译器就会计算出该变量型所需的字节数。
接着,我们给控制变量赋值,给其下的所有图层变量都加上“未使用”标签。做完这一步,这个函数就完成了。
下面我们再做一个函数,用于取得新生成的未使用图层。

struct SHEET *sheet_alloc(struct SHTCTL *ctl)
{
	struct SHEET *sht;
	int i;
	for (i = 0; i < MAX_SHEETS; i++) {
		if (ctl->sheets0[i].flags == 0) {
			sht = &ctl->sheets0[i];
			sht->flags = SHEET_USE; /* 标记为正在使用 */
			sht->height = -1; /* 隐藏 */
			return sht;
		}
	}
	return 0;	/* 所有的SHEET都处于正在使用状态 */
}

在sheets0[]中寻找未使用的图层,如果找到了,就将其标记为“正在使用”,并返回其地址就可以了,这里没有什么难点。高度设为-1,表示图层的高度还没有设置,因而不是显示对象。
程序中出现的&ctl->sheets0[i]是“ctl->sheets0[i]的地址”的意思。也就是说,指的是&(ctl->sheets0[i]),而不是(&ctl)->sheets0[i]。

void sheet_setbuf(struct SHEET *sht, unsigned char *buf, int xsize, int ysize, int col_inv)
{
	sht->buf = buf;
	sht->bxsize = xsize;
	sht->bysize = ysize;
	sht->col_inv = col_inv;
	return;
}

这是设定图层的缓冲区大小和透明色的函数,这也没什么难的吧。
接下来我们写设定底板高度的函数。这稍微有些复杂,所以我们在程序中加入了不少注释。这里的updown就是“上下”的意思。


void sheet_updown(struct SHTCTL *ctl, struct SHEET *sht, int height)
{
	int h, old = sht->height; /* 存储设置前的高度信息 */

	/* 如果指定的高度过高或过低,则进行修正 */
	if (height > ctl->top + 1) {
		height = ctl->top + 1;
	}
	if (height < -1) {
		height = -1;
	}
	sht->height = height; /* 设定高度 */

	/* 下面主要是进行sheets[]的重新排列 */
	if (old > height) {	/* 比以前低 */
		if (height >= 0) {
			/* 把中间的往上提 */
			for (h = old; h > height; h--) {
				ctl->sheets[h] = ctl->sheets[h - 1];
				ctl->sheets[h]->height = h;
			}
			ctl->sheets[height] = sht;
		} else {	/* 隐藏 */
			if (ctl->top > old) {
				/* 把上面的降下来 */
				for (h = old; h < ctl->top; h++) {
					ctl->sheets[h] = ctl->sheets[h + 1];
					ctl->sheets[h]->height = h;
				}
			}
			ctl->top--; /* 由于显示中的图层减少了一个,所以最上面的图层高度下降 */
		}
		sheet_refresh(ctl); /* 按新图层的信息重新绘制画面 */
	} else if (old < height) {	/* 比以前高 */
		if (old >= 0) {
			/* 把中间的拉下去 */
			for (h = old; h < height; h++) {
				ctl->sheets[h] = ctl->sheets[h + 1];
				ctl->sheets[h]->height = h;
			}
			ctl->sheets[height] = sht;
		} else {	/* 由隐藏状态转为显示状态 */
			/* 将已在上面的提上来 */
			for (h = ctl->top; h >= height; h--) {
				ctl->sheets[h + 1] = ctl->sheets[h];
				ctl->sheets[h + 1]->height = h + 1;
			}
			ctl->sheets[height] = sht;
			ctl->top++; /* 由于已显示的图层增加了1个,所以最上面的图层高度增加 */
		}
		sheet_refresh(ctl); /* 按新图层信息重新绘制画面 */
	}
	return;
}

程序稍稍有些长,不过既然大家能看懂前面的程序,那么这个程序应该也是可以看明白的。
每一条语句并不比之前的语句难,只是整个程序变长了而已。最初可能很难看进去,但是如果一直坚持读下去的话,阅读程序的能力就会越来越强。
在这里插入图片描述
下面来说说在sheet updown中使用的sheet refresh函数。这个函数会从下到上描绘所有的图
层。refresh是“刷新”的意思。手机屏幕就是在1秒内完成多帧的描绘才做出动画效果的,这个
动作就被称为刷新。而这种对图层的刷新动作,与手机屏幕的动作有些相似,所以我们也给它起名字叫做刷新。

void sheet_refresh(struct SHTCTL *ctl)
{
	int h, bx, by, vx, vy;
	unsigned char *buf, c, *vram = ctl->vram;
	struct SHEET *sht;
	for (h = 0; h <= ctl->top; h++) {
		sht = ctl->sheets[h];
		buf = sht->buf;
		for (by = 0; by < sht->bysize; by++) {
			vy = sht->vy0 + by;
			for (bx = 0; bx < sht->bxsize; bx++) {
				vx = sht->vx0 + bx;
				c = buf[by * sht->bxsize + bx];
				if (c != sht->col_inv) {
					vram[vy * ctl->xsize + vx] = c;
				}
			}
		}
	}
	return;
}

对于已设定了高度的所有图层而言,要从下往上,将透明以外的所有像素都复制到VRAM中。
由于是从下开始复制,所以最后最上面的内容就留在了画面上。

现在我们来看一下不改变图层高度而只上下左右移动图层的函数–sheet slide。slide原意
是“滑动”,这里指上下左右移动图层。

void sheet_slide(struct SHTCTL *ctl, struct SHEET *sht, int vx0, int vy0)
{
	sht->vx0 = vx0;
	sht->vy0 = vy0;
	if (sht->height >= 0) { /* 如果正在显示 */
		sheet_refresh(ctl); /* 按新图层的信息刷新画面 */
	}
	return;
}

最后是释放已使用图层的内存的函数sheetfree。这个简单。

void sheet_free(struct SHTCTL *ctl, struct SHEET *sht)
{
	if (sht->height >= 0) {
		sheet_updown(ctl, sht, -1); /* 如果处于显示状态,则先设定为隐藏 */
	}
	sht->flags = 0; /* 未使用 */
	return;
}

下面我们将以上与图层相关的程序汇总到sheet.c中,所以就要改造HariMain函数了

void HariMain(void)
{
	init_keyboard();
	enable_mouse(&mdec);
	memtotal = memtest(0x00400000, 0xbfffffff);
	memman_init(memman);
	memman_free(memman, 0x00001000, 0x0009e000); /* 0x00001000 - 0x0009efff */
	memman_free(memman, 0x00400000, memtotal - 0x00400000);

	init_palette();
	shtctl = shtctl_init(memman, binfo->vram, binfo->scrnx, binfo->scrny);
	sht_back  = sheet_alloc(shtctl);
	sht_mouse = sheet_alloc(shtctl);
	buf_back  = (unsigned char *) memman_alloc_4k(memman, binfo->scrnx * binfo->scrny);
	sheet_setbuf(sht_back, buf_back, binfo->scrnx, binfo->scrny, -1); /* 没有透明色 */
	sheet_setbuf(sht_mouse, buf_mouse, 16, 16, 99);
	init_screen8(buf_back, binfo->scrnx, binfo->scrny);
	init_mouse_cursor8(buf_mouse, 99);/* 背景色号 99 */
	sheet_slide(shtctl, sht_back, 0, 0);
	mx = (binfo->scrnx - 16) / 2; /* 画面中央 */
	my = (binfo->scrny - 28 - 16) / 2;
	sheet_slide(shtctl, sht_mouse, mx, my);
	sheet_updown(shtctl, sht_back,  0);
	sheet_updown(shtctl, sht_mouse, 1);
	sprintf(s, "(%3d, %3d)", mx, my);
	putfonts8_asc(buf_back, binfo->scrnx, 0, 0, COL8_FFFFFF, s);
	sprintf(s, "memory %dMB   free : %dKB",
			memtotal / (1024 * 1024), memman_total(memman) / 1024);
	putfonts8_asc(buf_back, binfo->scrnx, 0, 32, COL8_FFFFFF, s);
	sheet_refresh(shtctl);

	for (;;) {
		io_cli();
		if (fifo8_status(&keyfifo) + fifo8_status(&mousefifo) == 0) {
			io_stihlt();
		} else {
			if (fifo8_status(&keyfifo) != 0) {
				i = fifo8_get(&keyfifo);
				io_sti();
				sprintf(s, "%02X", i);
				boxfill8(buf_back, binfo->scrnx, COL8_008484,  0, 16, 15, 31);
				putfonts8_asc(buf_back, binfo->scrnx, 0, 16, COL8_FFFFFF, s);
				sheet_refresh(shtctl);
			} else if (fifo8_status(&mousefifo) != 0) {
				i = fifo8_get(&mousefifo);
				io_sti();
				if (mouse_decode(&mdec, i) != 0) {
					/* 因为已得到3字节的数据所以显示 */
					sprintf(s, "[lcr %4d %4d]", mdec.x, mdec.y);
					if ((mdec.btn & 0x01) != 0) {
						s[1] = 'L';
					}
					if ((mdec.btn & 0x02) != 0) {
						s[3] = 'R';
					}
					if ((mdec.btn & 0x04) != 0) {
						s[2] = 'C';
					}
					boxfill8(buf_back, binfo->scrnx, COL8_008484, 32, 16, 32 + 15 * 8 - 1, 31);
					putfonts8_asc(buf_back, binfo->scrnx, 32, 16, COL8_FFFFFF, s);
					/* 移动鼠标 */
					mx += mdec.x;
					my += mdec.y;
					if (mx < 0) {
						mx = 0;
					}
					if (my < 0) {
						my = 0;
					}
					if (mx > binfo->scrnx - 16) {
						mx = binfo->scrnx - 16;
					}
					if (my > binfo->scrny - 16) {
						my = binfo->scrny - 16;
					}
					sprintf(s, "(%3d, %3d)", mx, my);
					boxfill8(buf_back, binfo->scrnx, COL8_008484, 0, 0, 79, 15); /* 消除坐标 */
					putfonts8_asc(buf_back, binfo->scrnx, 0, 0, COL8_FFFFFF, s); /* 写坐标 */
					sheet_slide(shtctl, sht_mouse, mx, my); /* 有sheet_refresh */
				}
			}
		}
	}
}

我们准备了2个图层,分别是sht_back和sht_mouse,还准备了2个缓冲区buf_back和buf_mouse,用于在其中描绘图形。以前我们指定为binfo->vram的部分,现在有很多都改成了buf_back。而且每次修改缓冲区之后都要刷新。这段代码不是很难,大家能理解了吧。
在这里插入图片描述

不过其实这里面还是有问题。从图片来看确实很完美,可实际操作一下,你恐怕就要喊“吐
血啦!”。没错,它太慢了,而且画面还一闪一闪的。动一下鼠标就要郁闷一次,哪个用户想用这样的操作系统呢?所以下面我们就来解决这个问题吧。

2.提高叠加处理速度1.0

那么怎样才能提高速度呢?既然其他操作系统都能处理得那么快,就肯定有好的方法。首先,
我们从鼠标指针的移动,也就是图层的移动来思考一下。
鼠标指针虽然最多只有16x16 = 256个像素,可根据harib07b的原理,只要它稍一移动,程序就会对整个画面进行刷新,也就是重新描绘320x200 = 64000个像素。而实际上,只重新描绘移动相关的部分,也就是移动前后的部分就可以了,即256x2 = 512个像素(鼠标移动前和后,两个鼠标的大小)。这只是64000像素的0.8%而已,所以有望提速很多。现在我们根据这个思路写一下程序。

void sheet_refreshsub(struct SHTCTL *ctl, int vx0, int vy0, int vx1, int vy1)
{
	int h, bx, by, vx, vy;
	unsigned char *buf, c, *vram = ctl->vram;
	struct SHEET *sht;
	for (h = 0; h <= ctl->top; h++) {
		sht = ctl->sheets[h];
		buf = sht->buf;
		for (by = 0; by < sht->bysize; by++) {
			vy = sht->vy0 + by;
			for (bx = 0; bx < sht->bxsize; bx++) {
				vx = sht->vx0 + bx;
				if (vx0 <= vx && vx < vx1 && vy0 <= vy && vy < vy1) {
					c = buf[by * sht->bxsize + bx];
					if (c != sht->col_inv) {
						vram[vy * ctl->xsize + vx] = c;
					}
				}
			}
		}
	}
	return;
}

这个函数几乎和sheet refesh一样,唯一的不同点在于它能使用vx0~
vy1指定刷新的范围,而我们只追加了一个if语句就实现了这个新功能。另外,程序中的&&运算符是我们之前没有见过的,所以在这里详细解释一下。
&&运算符是把多个条件关系式连接起来的运算符。当用它连接的所有条件都满足时,就执行
{}中的程序;只要有一个条件不满足,就不执行(如果有else,就执行else后的语句)。另外,还有一个跟它很像的运算符“||”。“||”也是把多个条件关系式连接起来的运算符,不过由它连接的各个条件,只要其中一个满足了,就执行{}中的程序。简而言之,&&就是“而且”,而‖是“或者”。
条件“vx大于等于vx0且小于vx1”可以用数学式vx0<=vx<vx1来表达,但在C语言中不能这样写,我们只能写成vx0<=vx && vx<vx1。
现在我们使用这个refeshsub函数来提高sheetslide的运行速度。

void sheet_slide(struct SHTCTL *ctl, struct SHEET *sht, int vx0, int vy0)
{
	int old_vx0 = sht->vx0, old_vy0 = sht->vy0;
	sht->vx0 = vx0;
	sht->vy0 = vy0;
	if (sht->height >= 0) { /* 如果正在显示,则按新图层的信息刷新画面 */
		sheet_refreshsub(ctl, old_vx0, old_vy0, old_vx0 + sht->bxsize, old_vy0 + sht->bysize);/* 移动之前 */
		sheet_refreshsub(ctl, vx0, vy0, vx0 + sht->bxsize, vy0 + sht->bysize);/* 移动之后 */
	}
	return;
}

这段程序所做的是:首先记住移动前的显示位置,再设定新的显示位置,最后只要重新描绘
移动前和移动后的地方就可以了。

估计大家会认为“这次鼠标的移动就快了吧”,但移动鼠标时,由于要在画面上显示坐标等
信息,结果又执行了sheet_refesh程序,所以还是很慢。为了不浪费我们付出的各种努力,下面我们就来解决一下图层内文字显示的问题。
我们所说的在图层上显示文字,实际上并不是改写图层的全部内容。假设我们已经写了20
个字,那么8x16x20-2560.也就是仅仅重写2560个像素的内容就应该足够了。但现在每次却要重写64 000个像素的内容,所以速度才那么慢。
这么说来,这里好像也可以使用refresh_sub,那么我们就来重新编写函数sheet_refresh吧。

void sheet_refresh(struct SHTCTL *ctl, struct SHEET *sht, int bx0, int by0, int bx1, int by1)
{
	if (sht->height >= 0) { /* 如果正在显示,则按新图层的信息刷新画面 */
		sheet_refreshsub(ctl, sht->vx0 + bx0, sht->vy0 + by0, sht->vx0 + bx1, sht->vy0 + by1);
	}
	return;
}

这次指定的范围,并不是直接指定画面内的坐标,而是以缓冲区内的坐标来表示。这样一来,HariMain就可以不考虑图层在画面中的位置了。
我们改动了refresh,所以也要相应改造updown。做了改动的只有sheet_refresh(ctl)这部分
(有两处),修改后的程序如下:
sheet_refreshsub(ctl,sht->vx0,sht->vy0, sht->vx0 + sht->bxsize, sht->vy0 + sht->bysize) ;
最后还要改写HariMain:

void HariMain(void)
{
	sprintf(s, "memory %dMB   free : %dKB",
			memtotal / (1024 * 1024), memman_total(memman) / 1024);
	putfonts8_asc(buf_back, binfo->scrnx, 0, 32, COL8_FFFFFF, s);
	sheet_refresh(shtctl, sht_back, 0, 0, binfo->scrnx, 48);/* 这里 */

	for (;;) {
		io_cli();
		if (fifo8_status(&keyfifo) + fifo8_status(&mousefifo) == 0) {
			io_stihlt();
		} else {
			if (fifo8_status(&keyfifo) != 0) {
				i = fifo8_get(&keyfifo);
				io_sti();
				sprintf(s, "%02X", i);
				boxfill8(buf_back, binfo->scrnx, COL8_008484,  0, 16, 15, 31);
				putfonts8_asc(buf_back, binfo->scrnx, 0, 16, COL8_FFFFFF, s);
				sheet_refresh(shtctl, sht_back, 0, 16, 16, 32);/* 这里 */
			} else if (fifo8_status(&mousefifo) != 0) {
				i = fifo8_get(&mousefifo);
				io_sti();
				if (mouse_decode(&mdec, i) != 0) {
					/* �f�[�^��3�o�C�g�������̂ŕ\�� */
					sprintf(s, "[lcr %4d %4d]", mdec.x, mdec.y);
					if ((mdec.btn & 0x01) != 0) {
						s[1] = 'L';
					}
					if ((mdec.btn & 0x02) != 0) {
						s[3] = 'R';
					}
					if ((mdec.btn & 0x04) != 0) {
						s[2] = 'C';
					}
					boxfill8(buf_back, binfo->scrnx, COL8_008484, 32, 16, 32 + 15 * 8 - 1, 31);
					putfonts8_asc(buf_back, binfo->scrnx, 32, 16, COL8_FFFFFF, s);
					sheet_refresh(shtctl, sht_back, 32, 16, 32 + 15 * 8, 32);/* 这里 */
					mx += mdec.x;
					my += mdec.y;
					if (mx < 0) {
						mx = 0;
					}
					if (my < 0) {
						my = 0;
					}
					if (mx > binfo->scrnx - 16) {
						mx = binfo->scrnx - 16;
					}
					if (my > binfo->scrny - 16) {
						my = binfo->scrny - 16;
					}
					sprintf(s, "(%3d, %3d)", mx, my);
					boxfill8(buf_back, binfo->scrnx, COL8_008484, 0, 0, 79, 15); /* 消除坐标 */
					putfonts8_asc(buf_back, binfo->scrnx, 0, 0, COL8_FFFFFF, s); /* 重写坐标 */
					sheet_refresh(shtctl, sht_back, 0, 0, 80, 16);/* 这里 */
					sheet_slide(shtctl, sht_mouse, mx, my);
				}
			}
		}
	}
}

这里我们仅仅改写了sheetrefresh,变更点共有4个。只有每次要往buf_back中写人信息时
才进行sheet_refresh。
这样应该可以顺利运行了。我们赶紧试一试。“make run”。哦,确实比以前快多了。太好了!不过还是欠缺一些东西…

3提高叠加处理速度 2.0

虽然我们想了如此多的办法,但结果还是没有达到我们的期望,真让人郁闷。到底是怎么回
事呢?原来还是refeshsub有些问题。

void sheet_refreshsub(struct SHTCTL *ctl, int vx0, int vy0, int vx1, int vy1)
{
	int h, bx, by, vx, vy;
	unsigned char *buf, c, *vram = ctl->vram;
	struct SHEET *sht;
	for (h = 0; h <= ctl->top; h++) {
		sht = ctl->sheets[h];
		buf = sht->buf;
		for (by = 0; by < sht->bysize; by++) {
			vy = sht->vy0 + by;
			for (bx = 0; bx < sht->bxsize; bx++) {
				vx = sht->vx0 + bx;
				if (vx0 <= vx && vx < vx1 && vy0 <= vy && vy < vy1) {
					c = buf[by * sht->bxsize + bx];
					if (c != sht->col_inv) {
						vram[vy * ctl->xsize + vx] = c;
					}
				}
			}
		}
	}
	return;
}

依照这个程序,即使不写人像素内容,也要多次执行if语句,这一点不太好,如果能改善
下,速度应该会提高不少。
按照上面这种写法,即便只刷新图层的一部分,也要对所有图层的全部像素执行if语句,判
断“是写人呢,还是不写呢”。而对于刷新范围以外的部分,就算执行if判断语句,最后也不会进行刷新,所以这纯粹就是一种浪费。既然如此,我们最初就应该把for语句的范围限定在刷新范围之内。

void sheet_refreshsub(struct SHTCTL *ctl, int vx0, int vy0, int vx1, int vy1)
{
	int h, bx, by, vx, vy, bx0, by0, bx1, by1;
	unsigned char *buf, c, *vram = ctl->vram;
	struct SHEET *sht;
	for (h = 0; h <= ctl->top; h++) {
		sht = ctl->sheets[h];
		buf = sht->buf;
		/* vx0 ~ vy1,计算 by0 ~ by1 */
		bx0 = vx0 - sht->vx0;
		by0 = vy0 - sht->vy0;
		bx1 = vx1 - sht->vx0;
		by1 = vy1 - sht->vy0;
		if (bx0 < 0) { bx0 = 0; } /* 后面说明① */
		if (by0 < 0) { by0 = 0; }
		if (bx1 > sht->bxsize) { bx1 = sht->bxsize; } /* 后面说明② */
		if (by1 > sht->bysize) { by1 = sht->bysize; }
		for (by = by0; by < by1; by++) {
			vy = sht->vy0 + by;
			for (bx = bx0; bx < bx1; bx++) {
				vx = sht->vx0 + bx;
				c = buf[by * sht->bxsize + bx];
				if (c != sht->col_inv) {
					vram[vy * ctl->xsize + vx] = c;
				}
			}
		}
	}
	return;
}

改良的关键在于,bx在for语句中并不是在0到bxsize之间循环,而是在bx0到bx1之间循环(对
于by也一样 )。而bx0和bx1都是从刷新范围“倒推”求得的。倒推其实就是把公式变形转换了一下,具体如下:
vx = sht->vx0 + bx;
bx = v - sht->vx0;
计算vx0的坐标相当于bx中的哪个位置,然后把它作为bx0。其他的坐标处理方法也一样。
这样算完以后,就该执行以上程序中说明(1)的地方了。这行代码用于处理刷新范围在图层外
侧的情况。什么时候会出现这种情况呢?比如在sht_back中写人字符并进行刷新,而且刷新范围的一部分被鼠标覆盖的情况。
在这里插入图片描述

总结

仅仅改了这些地方,就可以提高速度吗?我们来试一下。“make run”(要等待一会儿)。
哦,这次感觉很好,操作系统正在迅速地运行,太开心了!虽然从表面上看不出有什么不同,不过这次我们要附上照片,展示一番。太棒了!
在这里插入图片描述
今天是元旦,祝大家平安喜乐~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/946451.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

C语言性能优化:从基础到高级的全面指南

引言 C 语言以其高效、灵活和功能强大而著称&#xff0c;被广泛应用于系统编程、嵌入式开发、游戏开发等领域。然而&#xff0c;要写出高性能的 C 语言代码&#xff0c;需要对 C 语言的特性和底层硬件有深入的了解。本文将详细介绍 C 语言性能优化的背后技术&#xff0c;并通过…

unity学习4:git和SVN的使用差别

目录 1 svn 1.1 操作逻辑 1.2 对应工具 1.3 SVN避免冲突的好习惯 2 git 2.1 git的基础操作逻辑 2.1.1 commit时&#xff0c;提交文件之外的其他文件需要pull 2.1.2 commit时&#xff0c;发现要提交的本地文件和服务器的文件冲突了 2.1.3 pull 时 2.2 对应工具 2.3 …

2024 年博客总结

2024年 我做了个Hexo博客 &#xff0c;博客地址为&#xff1a;https://blog.mybatis.io。 2024 年发布的文章 一共发布了 31 篇博客&#xff0c;平均一个月 2.6 篇。 Ollama 导入自定义模型 阅读数/评论数: 7433/5Spring AI 使用本地 Ollama Embeddings 阅读数/评论数: 5311…

Python中PDF转Word的技术

Python PDF转Word技术概述 在日常办公和数据处理中&#xff0c;经常需要将PDF文档转换为Word文档&#xff0c;以便进行编辑、修改或格式调整。Python作为一种强大的编程语言&#xff0c;提供了多种库和工具来实现这一功能。以下是对Python中PDF转Word技术的详细介绍。 一、技…

vue3+ts+element-plus 表单el-form取消回车默认提交

问题描述&#xff1a;在表单el-form中的el-input中按回车后&#xff0c;页面会刷新&#xff0c;url也会改变&#xff0c; 回车前&#xff1a; 回车后&#xff1a; 相关代码&#xff1a; 解决方法1&#xff1a;在 el-form 上阻止默认的 submit 事件&#xff0c;增加 submit.pre…

【数据结构05】排序

系列文章目录 【数据结构05】排序 . 【算法思想04】二分查找 文章目录 系列文章目录[toc] 1. 基本思想与实现1.1 插入类排序1.1.1 直接插入排序&#xff08;*&#xff09;1.1.2 折半插入排序1.1.3 希尔排序&#xff08;*&#xff09; 1.2 交换类排序1.2.1 冒泡排序&#xff08…

QT----------文件系统操作和文件读写

一、输入输出设备类 功能&#xff1a; Qt 提供了一系列的输入输出设备类&#xff0c;用于处理不同类型的 I/O 操作&#xff0c;如文件、网络等。 二、文件读写操作类 QFile 类&#xff1a; 提供了对文件的读写操作&#xff0c;可以打开、读取、写入和关闭文件。示例&#x…

Qt自定义步骤引导按钮

1. 步骤引导按钮 实际在开发项目过程中&#xff0c;由一些流程比较繁琐&#xff0c;为了给客户更好的交互体验&#xff0c;往往需要使用step1->step2这种引导对话框或者引导按钮来引导用户一步步进行设置&#xff1b;话不多说&#xff0c;先上效果 2. 实现原理 实现起来…

《Java核心技术II》流中的filter、map和flatMap方法

filter、map和flatMap方法 filter filter通过转换产生过滤后的新流,将字符串流转化为只包含长单词的另一个流。 List words ...; Stream longWords words.stream().filter(w->w.length()>12) filter类型是Predicate(谓词&#xff0c;表示动作)类型对象&#xff0c…

Junit4单元测试快速上手

文章目录 POM依赖引入业务层测试代码Web层测试代码生成测试类文件 在工作中我用的最多的单元测试框架是Junit4。通常在写DAO、Service、Web层代码的时候都会进行单元测试&#xff0c;方便后续编码&#xff0c;前端甩锅。 POM依赖引入 <dependency><groupId>org.spr…

FPGA自学之路:到底有多崎岖?

FPGA&#xff0c;即现场可编程门阵列&#xff0c;被誉为硬件世界的“瑞士军刀”&#xff0c;其灵活性和可编程性让无数开发者为之倾倒。但谈及FPGA的学习难度&#xff0c;不少人望而却步。那么&#xff0c;FPGA自学之路到底有多崎岖呢&#xff1f; 几座大山那么高&#xff1f;…

【Leecode】Leecode刷题之路第97天之交错字符串

题目出处 97-交错字符串-题目出处 题目描述 个人解法 思路&#xff1a; todo代码示例&#xff1a;&#xff08;Java&#xff09; todo复杂度分析 todo官方解法 97-交错字符串-官方解法 方法1&#xff1a;动态规划 思路&#xff1a; class Solution {public boolean isInte…

【微服务】【Sentinel】认识Sentinel

文章目录 1. 雪崩问题2. 解决方案3. 服务保护技术对比4. 安装 Sentinel4.1 启动控制台4.2 客户端接入控制台 参考资料: 1. 雪崩问题 微服务调用链路中的某个服务故障&#xff0c;引起整个链路中的所有微服务都不可用&#xff0c;这就是雪崩。动图演示&#xff1a; 在微服务系统…

使用 Three.js 创建几何体粒子效果

今天,带大家一起看下如何将几何体由粒子组成的效果。 通常情况下&#xff0c;Three.js 中的几何体材质会为每个面赋予一种颜色&#xff0c;这样的结果比较常见&#xff0c;如下图所示&#xff1a; 然而&#xff0c;通过将几何体由粒子组成&#xff0c;我们可以实现更加酷炫和…

shell指令

终端输入一个C源文件名&#xff08;.c结尾&#xff09;判断文件是否有内容&#xff0c;如果没有内容删除文件&#xff0c;如果有内容编译并执行改文件。 终端输入两个文件名&#xff0c;判断那个时间戳更新

使用ONVIF操纵大华摄像头

使用1台大华网络相机&#xff0c;DH-IPC-HFW3237M-I2&#xff0c;6毫米镜头&#xff0c;2百万像素&#xff0c;但是网口是百兆的。 大华的SDK感觉好难用。 写完了data matrix识别的0.1版本后&#xff0c;进行相机部分改进。 老规矩&#xff0c;先用python快速原型。 会出现一个…

Pandas-数据分组

文章目录 一. 分组聚合1. 分组聚合过程2. Pandas,Numpy内置的聚合方法3. 聚合函数① 使用Numpy库的mean函数② 自定义函数Ⅰ. 一个参数Ⅱ. 多个参数 ③ agg和 aggregateⅠ. 传入一个函数Ⅱ. 同时传入多个函数Ⅲ. 向agg/aggregate中传入字典 二. 分组转换1. 使用transform分组计…

云计算课程报告实验-WordCount算法实验 过程记录

内容描述 本实验指导书通过在华为鲲鹏上&#xff0c;编译运行WordCount程序。完成实验操作后&#xff0c;读者会掌握简单的程序编写&#xff0c;如WordCount中的getWords、countWords、treeMerge。 实验环境 华为鲲鹏云主机、openEuler 20.03操作系统&#xff1b;安装mpich-3…

【paddle】初次尝试

张量 张量是 paddlepaddle&#xff0c; torch&#xff0c; tensorflow 等 python 主流机器学习包中唯一通货变量&#xff0c;因此应当了解其基本的功能。 张量 paddle.Tensor 与 numpy.array 的转化 import paddle as paddle import matplotlib.pyplot as plt apaddle.to_t…

Frontend - 分页(针对 python / Django )

目录 一、同个文件内&#xff08;方式一&#xff09; 1. 前端 html 2. 定义分页界面 3. 获取分页数据 4.后端根据前端分页需求&#xff0c;整理分页数据 5.显示情况 6. JsonResponse 相关知识 二、不同文件内依旧有效&#xff08;方式二&#xff0c;更优化&#xff09;…