模型化- 数字化转型的重要基石
在各行各业推行数字化转型过程中,构建信息化模型十分重要,它是数字化转型的基石。事实上,数字化转型的核心是“万物皆模型”,在工业领域,以德国为主导的工业4.0 发展进程中,标准信息模型的构建是主要工作之一。他们提出了资产管理壳模型的概念和一系列标准。并且着力于各种物理设备,软件服务等数字化模型的构建。步伐稳健又迅速。在产品研发阶段重点发展基于AutomationML语言的建模,而现场控制领域正逐步推广OPCUA 信息化模型和协议的应用。
所有的信息模型几乎都是采用了形式化语言描述的结构化数据。并且清晰地定义了模型的语义。使信息模型能够被机器和软件准确地理解和一致性性访问。主要的描述语言是XML 语言,鉴于JSON语言的处理简洁性,也有部分模型使用JSON格式描述。
共识-语言的基础
语言的核心是语法和语义。 对于人类自然语言而言,语法和语义都不是非常规范的。有时候是模糊的含义和简化的语法。人类依靠“社会俗称规约”相互理解。但是在大语言模型(LLM)还没有出现之前,机器仍然无法准确地使用自然语言相互交流。于是人类创建了各种形式化语言,它们具有严格的语法和语义定义。这种形式化语言是人类自然语言的一个子集。消除了自然语言的二义性。
机器之间交换信息的方式也受到严格的定义,这便是通信协议(protocol)。因此,语法,语义和协议是机器交流信息的三要素。
推广一种形式化机器语言的关键是语言的标准化及其推广。使用者之间达成共识。流行的机器之间的语言包括 modebus,TCP/IP,CAN,OPC UA ,,AutomationML,工业4.0 知产管理壳等等语言和协议。
万物皆模型-并非易事
从技术的角度来看,构建各种资产的数字化模型并不存在什么障碍。现代IT技术提供了各种方法和工具。但是实现“万物皆模型”的目标却并非易事。
采用开放的数字模型,意味着各利益方打破了原有的护城河,大公司除非找到了新的技术壁垒,它们不会轻易地拥抱开放系统。
数字化模型的生态没有形成之前,个别公司或者个别项目中采用基于模型的设计方法可能比传统设计工作量更大。学习和采纳模型化设计方法的意愿不足。
由于缺乏广泛的用户,模型化设计的工具软件短缺。
构建资产数字化模型需要专业领域的专家与自动控制与IT行业专家的通力合作。在德国和欧洲,这些行业的数字化模型是由专业的行业协会发起并组织实施的。而我国的行业协会不具备这样的组织能力。
由此可见,构建制造业资产数字化模型是一件说说容易,干起来费劲的事情。笔者看来,至今没有找到可行的方法。
大语言模型LLM-建模的新工具
大语言模型的出现,极大地提升了机器理解人类自然语言的能力。人们似乎看到了希望,十分能够直接使用自然语言提示大语言模型自动建立资产的数字化模型呢?
令人遗憾的是目前大模型目前还不能完成这项工作。由于工业领域的资产描述内容繁多,准确性和一致性要求非常高。而大语言模型构建的模型会出现一定概率的差异性。
中间语言-AI时代的建模方法
语言大模型是基于模型模板构建模型。而不是基于schema或者元模型规范来建立模型。因此,直接生成形式化的模型比较困难。
同样地,LLM 生成程序代码也是基于代码的实例来构建代码的。由于网络上程序代码比较多,所以效果要好一点,但是如果需要实现比较复杂的控制算法,它就无能为力了,除非是已有的标准算法。
以笔者的观点,如果要让LLM 生成形式化的模型文本或者复杂的程序代码,使用中间语言更加有效。
所谓中间语言(模型)是指一个介于自然语言和形式化语言之间的语言,它有利于从自然语言描述转换,有能够转化成为标准化的机器可读的程序或者模型。
中间语言有如下几个特点:
- 简单的结构化形式语言
比如使用JSON 格式或者其他DSL 语言描述。这种结构化模型能够通过程序转化为机器可读的形式化模型。能够通过程序转化为标准化的数字模型或者代码,例如管理壳,OPCUA 模型,计算机代码等。在转化过程中,根据模型的规范,自动添加规范中要求的语义、语法细节。
- 代码或者模型中增加了比较多的自然语言描述(Description)
有利于LLM 理解模型或者语言模型的含义,帮助LLM 准确地生成代码或者模型。
由此可见,中间语言是介于自然语言与计算机语言之间的一种“高级”语言。
初步的实验
(待续)