郑哲:学习、应用初探与探索创新 | 提升之路系列(四)

750f69b082c52ae0c232ec694dd8c615.png

导读

为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。

我是土木工程系2019级的博士生郑哲(图1)。通过本科系列实践和实习,我深刻了解到土木工程行业的自动化程度较低,设计、审图、施工过程中的很多工作都完全依赖人工。人工完成工作容易犯错,并且导致相关从业人员工作压力巨大。我希望能将重复的工作交给计算机去完成,让工程师能够专注于设计与创造。

644992ca78905115efc2917d96b5ae84.png

0aabf5ce65373b7fa0bc3fc18088bf2c.png 图1 个人生活照

2019年入学后我加入了大数据能力提升项目,该项目给了我提升自己代码能力、学习前沿算法以及与不同专业同学交流的机会。经过一年的学习,我获得了大数据项目的证书。更重要的是,我提升了自己的通过编程解决实际问题的能力。转眼已博四,临近毕业,回想起来,从这个项目中收获到了很多。以下将就我在大数据能力提升项目中的一些收获与体会进行总结。

一、学习阶段——打好基础、兴趣驱动

最初,我对于AI、大数据相关内容都了解很少。借助大数据能力提升项目这个优秀的平台,我选择了四门课程提升自己的大数据技能,并在一学年内获得了3门A,1门A-的成绩,获得了大数据项目证书。在龙明盛老师的《深度学习》课程中我了解到“自然语言处理是人工智能皇冠上的明珠”,因此我对自然语言处理特别感兴趣。于是又选择了《自然语言处理与文本挖掘》这门课程,该课程决定了博士研究方向甚至未来的工作路线。

二、应用初探——实践课

本项目的暑期大数据实践课程让我受益匪浅。我参与了清华大学建筑系&北京城市实验室(BCL)龙瀛老师的“基于高分遥感影响的城市空地识别”课题。该课题旨在实现自动的空地识别,计算城市空地率,从而为城市规范发展提供建议。我主要负责技术路线(图2)制定、数据标注以及代码撰写工作,具体包括:遥感影像预处理、基于DeepLabv3的分层空地识别算法、预测结果后处理。所提出的方法精度与领域专家接近,在效率方法提升了15倍以上,降低了对人工的依赖。该工作获得了龙瀛老师的高度评价、大数据实践课“优秀团队奖”,相关成果发表在城规TOP期刊“Landscape and Urban Planning”上。在此之后,该方法被BCL应用于国内上百个城市空地的评估。这次实践课让我迈出了 “提升土建行业自动化”的第一步。

6e5d079371b6dc2c0e7371c18eaa4389.png 

83df20ce9053d484b75f329597b6642b.png

图2 基于高分遥感影响的城市空地识别技术路线

三、探索创新——智能审查助力行业转型升级

建筑建设过程包括:设计、审查、施工、运维四个阶段。审查是控制设计质量的关键环节,因为设计审查纰漏导致的工期、成本损失最高分别可达9%和20%以上。但现有人工审查费时耗力错漏多,因此智能审查应运而生。但是智能审查中面临三个关键难题:计算机如何读懂自然语言编写的规范?计算机如何理解设计以及设计的性能?如何构建智能审查系统?因此,我的科研工作主要围绕上述三个问题展开:计算机如何理解土建文本规范、设计审查中性能仿真以及智能审图与设计系统构建三个部分。

3.1 计算机如何理解土建文本规范

土建行业现有规范都采用自然语言编写,因此,让计算机理解以自然语言编写的规范(称为自动规则解译)是实现自动审查的关键也是最困难的一步,需要在模型和算法方面实现突破。

在模型方面,针对通用预训练模型难以理解领域专业术语的难题。我构建了千万级字符的土木领域语料,基于迁移学习建立了领域知识嵌入增强的预训练模型(图3)。实现了让通用模型变成领域专家;在土建领域多类自然语言处理任务的性能提升。相关论文发表在计算机TOP期刊computers in industry。

8c901f7331a5d8320b4ae80927b8243d.png 

58947b0b858400caa5f40c911daf4df1.png

图3 领域知识嵌入增强的预训练模型

在算法方面,针对人工将文本规范编写为计算机代码效率低难拓展的难题。我利用上述领域语言模型,提出了支持语义对齐与隐式推理的复杂条文自动解译方法(图4)。实现了自动将文本形式的规范条文转化为计算机可执行代码。该算法在复杂句解译方面比现有算法精度提升35%。同时相比人工解译能提升5倍以上的效率。相关论文发表在土木顶刊Automation in Construction上。

aa62904db2ea3ce7c9f24d4969a5e2ca.pngbed579e878c1afd6accde1d8e9897445.png 

4dbcf6b2b303d91d1cf92494af5ceaa1.png

8273b30f6899732d563062b16e4965f2.png

图4 支持语义对齐与隐式推理的复杂条文自动解译方法

3.2设计审查中性能仿真

审查过程离不开对设计的性能仿真。在设计审查中的仿真模拟方面,我提出了有限元与物理引擎联合模拟方法,实现高真实感场景构建。技术应用于国内外多起重大倒塌事故的情景构建工作。

4e8ce8ea3977c90b33256fcb7e3cfb73.png91e4936985bca9466aea660ab5ef69f2.png

图5  (a)联合模拟方法(b)倒塌模拟应用

3.3智能审图与设计系统构建

在智能设计与审查系统构建方面,首先我基于前述文本理解模型与算法,建立了支持自动规则解译的智能审查系统,审查效率相比人工审查提升40倍(图6)。此外,我将前述模型应用到了课题组的剪力墙智能设计系列研究中,实现在剪力墙设计生成过程中考虑文本法规的指导(图7)。

feab867092d9f0ddc51cb614ef73afeb.png 

ef0aef1d85afa64e00365f01895fdce8.png

图 6 支持自动规则解译的智能审查系统

8ed71ab889a5608961764e2d4b3ca6d5.png 

19f49a2d0ebc14189c68c61ee0b4fc99.png

图7 剪力墙智能生成式设计生成过程中考虑文本法规的指导

四、总结

入学以来,大数据能力提升项目帮助我开拓了视野、取得了成长。不过,学习与研究是永无止境的。未来,我依然会坚定地、不断地为土建行业自动化转型升级做出自己的些许贡献。真诚祝愿大数据项目未来越来越好。

编辑:于腾凯

校对:林亦霖

e5e517043ce42ab5eff35e14051adbf2.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/16194.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

ros2 foxy创建一个包和节点-ubuntu20.04

文章目录 创建工作区目录创建包和节点colcon build编译CMakeLists.txt文件find_packageadd_executable package.xml面相过程的方式生命一个节点以面向对象的方式创建一个节点 创建工作区目录 mkdir -p ~/ros2_ws/src cd ~/ros2_ws我们创建了两个目录,ros2_ws和在他…

【电商必学】 WhatsApp 全新攻略:什么是交互式消息模板

网购与WhatsApp等社交通讯平台有着密不可分的关系,为什么这么说呢?因为基本上所有的网购的平台都会提供查询、下单方式给客户,而WhatsApp是全世界使用率最高的通讯平台,所以大部分电子商户都会选择WhatsApp Business与电子商务连接…

Linux pthread线程操作 和 线程同步与互斥操作

在Linux系统中玩线程,使用pthread,这篇博客记录如何创建线程和使用线程和线程的同步与互斥。 还有一份nginx线程池的代码供大家阅读学习! 目录 一、简介 什么是线程 线程的优点、缺点 线程的应用场合 二、线程的使用 1. 创建线程 - p…

高并发场景下JVM调优实践

一、背景 2021年2月,收到反馈,视频APP某核心接口高峰期响应慢,影响用户体验。 通过监控发现,接口响应慢主要是P99耗时高引起的,怀疑与该服务的GC有关,该服务典型的一个实例GC表现如下图: 可以…

最值得学的编程语言是哪个?

如果让我推荐的话,我肯定首选是python啦! 编程语言是一个计算机的概念,在我们有了计算机以后,想让它帮助我们做事情,就要通过计算机语言和它进行对话、交互,计算机语言能够被计算机所执行,完成…

【MFAC】基于全格式动态线性化的无模型自适应控制(Matlab代码)

例题来源:侯忠生教授的《无模型自适应控制:理论与应用》(2013年科学出版社)。 👉对应书本 4.4 单输入单输出系统(SISO)全格式动态线性化(FFDL)的无模型自适应控制(MFAC) 上两篇博客分别介绍了基于紧格式和偏格式动态线…

Linux命令集(Linux常用命令--cat指令篇)

Linux命令集(Linux常用命令--cat指令篇) Linux常用命令集(cat指令篇)4.cat(concatenate)1. 查看文件内容:2. 连接多个文件:3. 创建文件并通过终端写入内容4. 输出内容编号 Linux常用命令集(cat指…

【英语】大学英语CET考试,写作部分(论述文+应用文,6篇范文)

文章目录 3项评分标准(内容&结构,语言)0.1 论述文个人小结 1、论述文:审题与功能句2、论述文:修饰内容和名言模板3、论述文:现象作文&利弊分析4、论述文:给出权威论据和有侧重的现象5、…

在amd64与arm上用paddlelite部署paddelOCR(Ascend硬件)

由于部署的硬件是华为昇腾 NPU(Ascend310),参考网址https://www.paddlepaddle.org.cn/lite/v2.10/demo_guides/huawei_ascend_npu.html#npu-paddle-lite 先拉取paddlelite用来编译库 git clone https://github.com/PaddlePaddle/Paddle-Lit…

反转字符串——leetcode344、leetcode541

文章目录 简单反转字符串题目详情分析Java完整代码 反转链表进阶问题题目详情分析Java完整代码 简单反转字符串 题目详情 编写一个函数,其作用是将输入的字符串反转过来。输入字符串以字符数组 s 的形式给出。 不要给另外的数组分配额外的空间,你必须…

RMAN-03009、ORA-19566数据文件坏块报错处理方法

在备份数据库的时候,出现RMAN-03009、ORA-19566报错: RMAN-03009: backup 命令 (c3 通道上, 在 04/29/2023 10:58:11 上) 失败 ORA-19566: 超出损坏块限制 0 (文件 E:\APP\ADMINISTRATOR\ORADATA\JHSEMR\JHEMR2.DBF) 继续执行其他作业步骤, 将不重新运行…

Github创建一个新仓库,关联本地数据并上传文件的图文步骤

工作中,我们经常会使用github来承享别人的代码果实,同时我们也会把自己的成果分享给别人,互相帮助。 今天的这篇图文教程非常重要,目标是使用Github来创建一个远程仓库,并和本地仓库对接,同时要做上传新内容…

区域医疗云his系统源码,具有可扩展、易共享、易协同的优势

云HIS系统采用SaaS软件应用服务模式,提供软件应用服务多租户机制,实现一中心部署多机构使用。相对传统HIS单机构应用模式,它可灵活应对区域医疗、医疗集团、医联体、连锁诊所、单体医院等应用场景,并提升区域内应用的标准化与规范…

python处理图像的各种技术镜像、旋转、遮挡、叠加、条带化

2.6 图像镜面对称 1、将图像水平镜面转换。 2、将图像垂直镜面转换。 import random #导入模块 import numpy as np import matplotlib.pyplot as plt a plt.imread("1.jpg") # 将图像沿着水平方向重复三次。 ba.copy() da.copy() # 将图像水平镜面转换。&…

LeCun、田渊栋参与撰写,70页「自监督学习」大全

来源 | 机器之心 微信号:almosthuman2014 「关于自监督学习,你想知道但又不敢问的一切都在这里了。」图灵奖得主、Meta 人工智能首席科学家 Yann LeCun 刚刚发了这样一则推文。 在推文中,LeCun 介绍了他和 Meta 人工智能研究院研究员、研究经…

javaEE初阶 — 服务器版本的表白墙案例

文章目录 原来版本涉及的问题设计程序1 点击提交2 页面加载 实现后端代码1 新建一个 Maven 项目。2 按照之前第一个 Servlet 程序的步骤来进行设置3 新建一个 MessageServlet 类 实现前端代码1 点击提交的时给服务器发送一个 POST 请求2 在页面加载时发送一个 GET 请求3 将数据…

【2023 年第十三届 MathorCup 高校数学建模挑战赛】C 题 电商物流网络包裹应急调运与结构优化问题 赛后总结之31页论文及代码

相关信息 (1)建模思路 【2023 年第十三届 MathorCup 高校数学建模挑战赛】A 题 量子计算机在信用评分卡组合优化中的应用 详细建模过程解析及代码实现 【2023 年第十三届 MathorCup 高校数学建模挑战赛】 B 题 城市轨道交通列车时刻表优化问题 详细建…

2.3 定点乘法运算

学习目标: 如果我要学习定点乘法运算,我会按照以下步骤进行学习: 确定学习目标:明确学习定点乘法运算的目的和重点,以便有针对性地进行学习。 掌握基础知识:首先需要了解定点数和定点乘法的基础知识&…

PySide2 QWebEngine与Web js交互

文章目录 单向交互双向传值案例 单向交互 QWebEngineView加载web页面&#xff0c;web页面中点击按钮&#xff0c;执行js代码&#xff0c;js的返回值传给QWebEnginePage&#xff0c;使用python进行保存结果。 单向&#xff0c;js向python(PySide2)端传输数据。 前端实现 <…

力扣刷题day35|416分割等和子集

416. 分割等和子集 力扣题目链接 给你一个 只包含正整数 的 非空 数组 nums 。请你判断是否可以将这个数组分割成两个子集&#xff0c;使得两个子集的元素和相等。 示例 1&#xff1a; 输入&#xff1a;nums [1,5,11,5] 输出&#xff1a;true 解释&#xff1a;数组可以分割…