【PL理论深化】(2) 语法分析 (Syntax) | 编程语言的语法结构:文法 | 语义结构 (Sematics)

  • 💬 写在前面:编程语言是由归纳法生成的程序的集合。定义属于该语言的程序的形式的规则,即编写程序的规则,称为编程语言的 语法分析 (syntax) 而定义属于该语言的程序的意义的规则称为 语义结构(semantics)。这两者都是归纳定义的。

目录

0x00 语法分析(syntax analysis)

0x01 编程语言的语法结构:文法(grammar)

0x02 语义结构(Semantics)


0x00 语法分析(syntax analysis)

下面是一个由整数和四则运算符所构成的整数表达式集合,即整数表达式语言。

比如,以下整数表达式属于该语言中的程序:

.

像上述那样,程序通常用一维字符串来编写。

但实际上,计算机程序具有树形的二维结构,例如字符串:

我们将程序表示为树结构:

对应于图 (a) 的程序:

而对应于图 (b) 的程序,将用字符串编写的一维程序转换为二维树结构的技术 ——

称为 语法分析 (syntax analysis) 或 解析 (parsing) 。

(我们不会详细讨论语法结构分析的方法,而是着重于程序的结构如何呈现为树形)

0x01 编程语言的语法结构:文法(grammar)

假设程序的结构以树形结构明确给出,

整数表达式语言的语法结构可以通过以下推导规则归纳定义:

编程语言的语法结构通常采用 文法 (grammar) ,而不是推理规则来定义。

整数表达式语言的语法结构用文法表示如下:

上述规则表示有 5 种方法可以生成整数表达式。

根据第一条规则,任意整数 (n) 都可以是一个整数表达式。

而其余的规则意味着,对于任意两个整数表达式 E_1E_2

可以用四则运算符连接它们,从而创建一个新的整数表达式。

.

由于归纳规则的特性,通过这五种有限规则,可以生成无限多个任意的整数表达式。

例如,整数表达式 1+(2*(3-4)) 就是这样创建的:

如果将证明树的上下颠倒,并强调树的结构,就得到了图 (A) 。

像这样通过归纳定义的编程语言的语法结构,具有生成二维程序的规则。

.

为了将二维结构清晰地写成一维形式,只需适当地使用括号,例如表达为  1+(2*(3-4)) 。

0x02 语义结构(Semantics

如果语法结构是定义编程语言中程序外观的规则。

那么 语义结构 (semantics) 则是决定程序执行意义的规则。

程序的含义可以有多种定义,但对于整数表达式而言,

以计算表达式得到的整数值来定义其含义是最自然的。

我们可以这样表达:"计算整数表达式 E 得到整数 n " 或者 "整数表达式 E 的含义是 n "。

E\Rightarrow n

.

例如,1+(2*(3-4))\Rightarrow -1 表示程序 1+(2*(3-4)) 的含义是等于 −1。

这里的 \Rightarrow 表示一个关于程序和整数之间的二元关系。

换言之,若将程序的集合表示为 \mathbb P,整数的集合表示为 \mathbb Z

\Rightarrow 是 \mathbb P \times \mathbb Z 的一个子集 (即 \Rightarrow \subseteq \mathbb P \times \mathbb Z),它定义了整数表达式的语义结构。

对于整数表达式,可以通过以下推理规则来定义集合 \Rightarrow :

.

第一条规则 (E-Num) 对于任意整数 n,表示 (n,n) 是集合 \Rightarrow 的元素。

这里,整数 n 的意义被定义为整数值 n

第二条规则 (E-Plus) 表示如果 (E_1, n_1)(E_2,n_2) 是 \Rightarrow 的元素,

则 (E_1 + E_2, n_1+n_2) 也是 \Rightarrow 的元素,其余规则类似地定义。

.

然而,对于除法,定义限定 n2 不为零时才有意义。

例如,根据上述规则定义的集合 \Rightarrow 包含元素 \big((1+2)(3/3), 3\big) 。

整数表达式 (1+2)(3/3) 的含义被定义为 3。

可以证明 \big((1+2)*(3/3), 3\big)  是集合 \Rightarrow 的元素如下所示:

.

相对地,有些表达式可能看起来是正确的,但实际上可能没有定义。

例如,整数表达式 (3*4)/\big((1*2)-(1+1)\big) 对于任何整数 n

都无法通过推理规则 (3*4)/\big((1*2)-(1+1)\big) \Rightarrow n 进行证明。

.

因为整个表达式涉及除法,如果要证明它,就只能应用规则 \textrm{E-Div}

但在这种情况下,由于分母计算结果为 0,因此无法应用 \textrm{ E-Div} 规则。

这说明,并非所有通过编程语言的语法结构定义的程序都具有执行的实际意义。

即使通过了编译器的语法分析阶段,仍可能存在无法正确执行的程序!

.

到目前为止,我们已经从定义推理规则的角度定义了语义结构,

但是也可以直接从程序执行规则的角度解释这些规则。

例如,规则 \textrm{E-Plus} 描述了计算表达式 E_1 + E_2  的过程。

我们首先递归地计算表达式 E_1E_2 的值,得到 n_1n_2

然后定义为将这两个整数相加的过程。

通过这种方式解释语义结构,证明树的生成过程就成为程序执行的过程,

并且通过将语义结构定义为递归函数,我们可以直接获得编程语言的解释器 (interpreter) 。

📌 [ 笔者 ]   王亦优
📃 [ 更新 ]   2022.9.14
❌ [ 勘误 ]   /* 暂无 */
📜 [ 声明 ]   由于作者水平有限,本文有错误和不准确之处在所难免,
              本人也很想知道这些错误,恳望读者批评指正!

📜 参考资料 

- R. Neapolitan, Foundations of Algorithms (5th ed.), Jones & Bartlett, 2015.

- T. Cormen《算法导论》(第三版),麻省理工学院出版社,2009年。

- T. Roughgarden, Algorithms Illuminated, Part 1~3, Soundlikeyourself Publishing, 2018.

- J. Kleinberg&E. Tardos, Algorithm Design, Addison Wesley, 2005.

- R. Sedgewick&K. Wayne,《算法》(第四版),Addison-Wesley,2011

- S. Dasgupta,《算法》,McGraw-Hill教育出版社,2006。

- S. Baase&A. Van Gelder, Computer Algorithms: 设计与分析简介》,Addison Wesley,2000。

- E. Horowitz,《C语言中的数据结构基础》,计算机科学出版社,1993

- S. Skiena, The Algorithm Design Manual (2nd ed.), Springer, 2008.

- A. Aho, J. Hopcroft, and J. Ullman, Design and Analysis of Algorithms, Addison-Wesley, 1974.

- M. Weiss, Data Structure and Algorithm Analysis in C (2nd ed.), Pearson, 1997.

- A. Levitin, Introduction to the Design and Analysis of Algorithms, Addison Wesley, 2003. - A. Aho, J. Hopcroft, and J. Ullman, Data Structures and Algorithms, Addison-Wesley, 1983.

- E. Horowitz, S. Sahni and S. Rajasekaran, Computer Algorithms/C++, Computer Science Press, 1997.

- R. Sedgewick, Algorithms in C: 第1-4部分(第三版),Addison-Wesley,1998

- R. Sedgewick,《C语言中的算法》。第5部分(第3版),Addison-Wesley,2002

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/736301.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

QML 列表,图片展示(一)

文章目录 1.QML 列表,图片展示效果图2.项目基本说明3.项目详解3.1界面显示部分3.2 网络部分 4.源代码5.flickr图片查询链接,后面我们将调整代码,获取更多图片 1.QML 列表,图片展示效果图 2.项目基本说明 该项目来自Qt示例程序 Ph…

LabVIEW电路板故障诊断系统

基于LabVIEW软件开发的电路板故障诊断系统,涵盖功能测试、性能测试和通讯测试等多个方面。系统集成了多种硬件设备,包括NI PXI-1033机箱、NI PXI-4071数字万用表、NI PXI-4130电源模块、NI PXI-8512 CAN模块等,通过模块化设计实现了对电路板的…

HarmonyOS SDK助力鸿蒙原生应用“易感知、易理解、易操作”

6月21-23日,华为开发者大会(HDC 2024)盛大开幕。6月23日上午,《HarmonyOS开放能力,使能应用原生易用体验》分论坛成功举办,大会邀请了多位华为技术专家深度解读如何通过根技术、开放能力、场景化控件等亮点…

面向对象修炼手册(三)(行为与多态)(Java宝典)

​ 🌈 个人主页:十二月的猫-CSDN博客 🔥 系列专栏: 🏀面向对象修炼手册 💪🏻 十二月的寒冬阻挡不了春天的脚步,十二点的黑夜遮蔽不住黎明的曙光 目录 前言 行为 1 静态行为和动态…

技术管理转型之战:解锁管理新境界——直觉决策的艺术与科学

文章目录 引言一、直觉决策的定义与特点二、直觉决策在管理中的价值三、直觉决策的来源1、潜意识的心里过程2、基于价值观或道德的决策3、基于经验的决策4、影响发动的决策5、基于认知的决策 四、如何培养直觉决策能力五、直觉决策的风险与应对结语 引言 在快速变化的商业环境…

查找和排序

目录 一、查找 1.1查找的基本概念 1.2顺序查找 1.3折半查找(二分查找) 1.4散列表的查找 1.4.1基本概念 1.4.2散列函数的构造方法 1.4.3解决冲突的方法 二、排序 2.1排序的基本概念 2.2插入排序 2.2.1直接插入排序: 2.2.2希尔排序…

CSS属性选择器学习记录(4)

目录 1、CSS 属性 选择器 1.1、CSS [attribute|value] 选择器 1.2、实例 2、具有特定属性的HTML元素样式 3、属性选择器 4、属性和值选择器 5、属性和值的选择器 - 多值 6、表单样式 1、CSS 属性 选择器 顾名思义,CSS 属性选择器就是指可以根据元素的属性以…

Centos7 Mysql8.3.0 安装地址

MySQL :: Download MySQL Community Server (Archived Versions)

力扣SQL50 查询近30天活跃用户数 datediff(日期1,日期2)

Problem: 1141. 查询近30天活跃用户数 👨‍🏫 参考题解 -- 选择活动日期作为天数,计算每天的唯一活跃用户数 select activity_date as day, count(distinct user_id) as active_users from activity -- 从2019年7月27日开始的30天内 where …

c#考试知识点

第一题 //数组{1,2,3,,8,6} //方法(数组,目标值) //输出 //接收一个数组,输出目标值是数组中哪两个数的和,并输出下标 using System; using System.Collectio…

《三国:谋定天下》成为了SLG游戏现象级的成功案例

原标题:《三国:谋定天下》引领SLG游戏新潮流,B站股价五个飙升了30% 易采游戏网6月23日:B站作为年轻人喜爱的文化社区和视频平台,再次用一款新的游戏证明了其在游戏发行领域的独到眼光与强大实力。最近大火的策略角色扮…

【python】python海底捞门店营业数据分析与可视化(数据集+源码+论文)【独一无二】

👉博__主👈:米码收割机 👉技__能👈:C/Python语言 👉公众号👈:测试开发自动化【获取源码商业合作】 👉荣__誉👈:阿里云博客专家博主、5…

Vue elementui表格

去除表头 <el-table:data"tableData"stripestyle"width: 100%":cell-style"{ text-align: justify-all }":show-header"false"></el-table>合并 <template><div class"elife-container"><el-ro…

【前端vue3】TypeScrip-Class类用法

类型声明 TypeScrip定义Class类 语法&#xff1a; // 定义一个名为 Person 的类 class Person {constructor () {// 构造函数&#xff1a;稍后定义}run () {// 方法&#xff1a;稍后定义} }在TypeScript是不允许直接在constructor 定义变量的 需要在constructor上面先声明 例…

AI 大模型企业应用实战(06)-初识LangChain

LLM大模型与AI应用的粘合剂。 1 langchain是什么以及发展过程 LangChain是一个开源框架&#xff0c;旨在简化使用大型语言模型构建端到端应用程序的过程&#xff0c;也是ReAct(reasonact)论文的落地实现。 2022年10月25日开源 54K star 种子轮一周1000万美金&#xff0c;A轮2…

【学习笔记】Mybatis-Plus(三):MP中Wrapper的使用

Wrapper简介 注意&#xff1a; 查询用QueryWrapper和LambdaQueryWrapper来封装 updateWrapper和LambdaUPdateWrapper不但能封装查询还能更改要更新的对象。 QueryWrapper的使用 QueryWrapper中的很多条件限定都是见名知其意的。下表列出来几个常用的&#xff1a; 1.多条件进行…

拖拽劫持与数据窃取

2010 年&#xff0c;ClickJacking 技术有了新的发展。一位名叫 Paul Stone 的安全研究者在 BlackHat 2010 大会上发表了题为“Next Generation Clickjacking”的演讲。在该演讲中&#xff0c;提出了“浏览器 拖拽事件”导致的一些安全问题。 目前很多浏览器都开始支持 Drag &a…

智能风控(原理、算法与工程实践)项目一

本文介绍该书第一章的项目&#xff1a;运用CART树进行规则挖掘&#xff0c;具体代码如下 #!/usr/bin/env python # coding: utf-8 # In[1]: import pandas as pd import numpy as np import os # In[2]: data pd.read_excel( ./data_for_tree.xlsx) # In[3]: data.h…

(南京观海微电子)——TFT LCD压合技术

TFT-LCD TFT-LCD open cell后段制程主要指的是将驱动IC和PCB压合至液晶板上&#xff0c;这个制程主要由三个步骤组成&#xff1a; 1.ACF (Anisotropic Conductive Film)的涂布。 在液晶板需要压合驱动IC的地方涂布ACF&#xff0c;ACF又称异方性导电胶膜&#xff0c;特点是上下…

编程精粹—— Microsoft 编写优质无错 C 程序秘诀 07:编码中的假象

这是一本老书&#xff0c;作者 Steve Maguire 在微软工作期间写了这本书&#xff0c;英文版于 1993 年发布。2013 年推出了 20 周年纪念第二版。我们看到的标题是中译版名字&#xff0c;英文版的名字是《Writing Clean Code ─── Microsoft’s Techniques for Developing》&a…