实验四:四代编译器实验
一、实验要求
详细实验要求请参考文件《Lab4实验说明和要求.pdf》。
二、实验思路
1、与 lab3 的对比
如果你在 lab3 就已经像我一样单独写了个函数处理表达式,那么理论上,lab4 相比于 lab3,不过就是多了对 if
和 while
等语句的处理,而其他部分几乎不需要任何改变!
这样一来,lab4 就非常简单了。因此,本文是基于 lab3 的代码上进行修改,关于 lab3 的文章在这里:http://t.csdnimg.cn/sQcsP
2、函数的划分
现在,不能简单地通过 }
的出现位置来区分不同的函数块,这是因为函数内的 if
或 while
语句块通常也会出现 }
.
如果你仍然希望实现预先对函数进行划分,一种可行的做法是:维护一个变量 left_brace_minus_right_brace
,它等于 左大括号的数量-右大括号的数量
,当且仅当 }
的位置满足left_brace_minus_right_brace = 0
时,表明这个 }
用于划分函数是有效的。
3、句子的识别
现在,句子不总是以 ;
作为结尾,因为 if
或 while
语句块通常以 }
结尾,这意味着仅使用 ;
分割两个句子是不完全正确的。为了解决这个问题,你需要添加一些其他的条件判断。
4、句子的处理
注意:这里仅提供我的方法,实际上你应该结合自己的理解和自己的代码进行修改!
对于 if
和 while
,你觉得一个句子应该在什么地方进行划分?
我这里的做法简单来说,是按照有效的 }
进行划分,我举一个例子。有如下代码:
if ( a>3 ) {
if ( a<10 ) {
println_int(a);
}
while ( a<b ) {
println_int(b);
a=a+1;
}
}
那么,对于上面的例子,我认为
if (a>3) { if (a<10) { println_int(a); } while (a<b) { println_int(b); a=a+1; } }
Δ Δ
是一个句子。在这个句子中,含有两个子句,它们分别是
if (a<10) { println_int(a); }
Δ Δ
while (a<b) { println_int(b); a=a+1; }
Δ Δ
对于前者,它又含有一个子句
println_int(a);
对于后者,它含有两个子句,分别是
println_int(b);
a=a+1;
这样的结构,令我想到了递归。显然,如同我在 lab3 中单独写一个函数处理表达式,现在,我要单独写一个函数处理句子。
对于一个句子,直接调用该函数;如果句子内部又含有句子,则递归调用这个函数。
说实话,到这个时候,我也不敢说自己的做法是不是高明,所以请你自己思考一下,你会用什么样的方法来处理 if
或 while
的语句块?
5、if
对应的汇编语句
if
语句处理十分简单,它的代码结构一定是:
if ( 表达式 ) {
一些句子
}
对应的汇编是:
6、while
对应的汇编语句
while
语句处理相比于 if
稍微复杂一些,我们先不考虑 continue
和 break
,它的代码结构一定是:
while ( 表达式 ) {
一些句子
}
对应的汇编是:
while
的内部每多一个 continue
,就多一对 jump
,如下图所示:(可以交换 jump1:
和 jump3:
)
while
的内部每多一个 break
,就多一对 jump
,如下图所示:(可以交换jump2:
和 jump4:
)
你最好先理解了再写代码,不然写起来会很费劲的。
三、实验注意
-
该部分主要阐述本人在做该实验时踩过的坑
-
提交方式:和 lab3 一样
-
任何跳转的入口名都不能一样,例如有汇编语句:
... je .L_while_end_1 # 入口名一样 ... je .L_while_end_1 # 入口名一样 ... .L_while_end_1: ...
这样写就会报错。
-
局部变量
这里指的是
if
和while
内部定义的变量,例如:if (a==b) { int c; c = a+b; println_int(c); }
有时候,你可能需要注意对这种变量的处理。