宋绪杰:我的大数据成长之旅 | 提升之路系列(三)

68a009972d6179394928a60df88ff1c1.png


导读

为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。

两年前,我成为了清华大学车辆学院的一名硕士生,随着对专业认识的不断深入,我发现车辆领域的前沿研究逐渐走向了智能化,以自动驾驶为代表的前沿技术将彻底重塑未来生活。置身于智能化的浪潮之中,我意识到必须顺应时代潮流,“大数据能力提升项目”的培养方案使我眼前一亮,于是在入学之初便完成了报名,开始了我的“大数据成长之旅”。

589dcf91e2c003cb5cb3a2c40cf5a90e.png 

512226cfeff709ec9e73c6e3887a94ab.png

图1生活照

一、勤思好学,夯实学科基础

为筑牢大数据与人工智能学科基础,我选择了4门课程:深度学习(A-)、统计学习理论与应用(A)、大数据分析(A)以及大数据实践课(A-)。在硕士期间,包括这4门课程在内的所有课程均获A-及以上成绩,GPA达到4.0满绩,GPA排名院系第一。大数据项目的课程使我系统性地掌握了大数据与人工智能的学科知识,为后续的研究打下了坚实基础。

基于深度学习、统计学习课程学习到的知识,我们在大数据分析、大数据实践课程中分别参加了两项竞赛——天池-淘宝穿衣搭配挑战赛、中国高校计算机大赛-微信大数据挑战赛。在淘宝穿衣搭配挑战赛中,最终排名21/3408;在微信大数据挑战赛中,获得了全国三等奖。也正是大数据项目中扎实的实践和理论学习,让我顺利在商汤科技、旷视科技、阿里巴巴进行了三段实习,给了我继续深耕数据科学和AI领域的底气。

二、不负韶华,学科交叉创新

大数据项目也让激发了我的研究思路。以自动驾驶为代表的工业决控任务急需智能化改进,强化学习正是智能决控方法的代表,然而强化学习输出的控制动作通常具有波动性,不能真正满足现实世界中高精度决控任务的需求。为解决这一问题,我开始了以强化学习动作平滑性为主题的研究,希望为强化学习在工业场景的真正落地添砖加瓦。

对于强化学习的动作震荡问题,我曾在深度学习的课间休息时间请教过龙明盛老师,而后基于深度学习课程中系统性讲授过的神经网络设计思路,我设计了具有Lipschitz连续性的Actor网络——LipsNet,使强化学习的动作震荡问题得到了很好的改善。在这项工作中,我们与滴滴出行进行了深度合作,研究问题真正来源于实际、应用于实际。在自动驾驶轨迹跟踪任务中,LipsNet相比MLP的动作震荡率降低了90.2%,极大增强了强化学习决控的动作稳定性;在MuJoCo等控制任务中也有显著改善。且LipsNet可以适用于任何Actor-Critic构架的强化学习算法,具有极强的适用性。

这篇文章最终发表在了2023年的ICML会议(CCF-A)中。这次会议在风景优美的夏威夷举办,在参会过程中,我被大数据和AI领域的快速发展深深震撼到了,更加坚定了投身大数据与AI领域的决心。值得一提的是,在夏威夷竟然遇到了当年深度学习课程的助教学长,我在与学长和全球各地学者的交流中,增长了友谊和见识,仿佛感觉我与大数据领域的纽带更深了。

1771ded165df42c6f94aa81a322e0db9.png

694fbf26e34c7cc4822fc5fa79dc4635.png图2在ICML会议中讲解海报

在会议结束后,我参加了车辆学院的博士生论坛,在“智能出行与智慧交通”分论坛中用英文汇报了论文成果,以硕士生的身份获得了分论坛的唯一一名口头报告一等奖。随后,我们还持续创新,将LipsNet应用在了扫地机器人等真实工业任务场景中,并产出一篇EI期刊论文,实现了用大数据和AI技术对工业对象赋能。

29fa068cfbfa38467f55aa754b260d2b.png

图3博士生论坛口头报告

三、勇攀高峰,挑战科学极限

在上述成果发表之后,导师与我进行了长谈,告诉我发表论文不是最终目的,并鼓励我在数据科学和AI领域做更加深刻、更有意义的研究,在芯片禁运的大背景下,要服务于国家战略、研究突破性技术方案。随后,在导师的支持下,我迈向了数据科学更加纵深和基础的领域,开始研究如何用量子计算加速神经网络的训练,希望以QPU(量子计算机)的高速计算能力破“GPU禁运之局”。

我们选择了最有可能在近些年商业化和规模化的量子计算机——伊辛机(Isingmachine),而当时鲜有在伊辛机上训练神经网络的方法,我们在研发过程中遇到了不小的困难。在科研过程中,我时常翻出深度学习课程的PPT查阅,反复细致地理解神经网络的传播结构,并尝试找到合适的训练方案。可以说,在大数据项目中学到的知识,对我每一个阶段的研究都产生了极其重大的助力。

经过不懈努力,我们发明了一种在伊辛机上训练前馈神经网络的算法——Isinglearningalgorithm,在简化版MNIST数据集中,仅需0.7秒便可完成训练,并且测试集准确率可以达到98.3%。而后,在导师的支持下,我们同时申请了中美两国专利。仅仅在论文上传arXiv的两周后,便有来自硅谷的伊辛机创业公司主动联系到我们,表达了对论文的强烈认可,以及对寻求合作的希望;此外,我们还与玻色量子等科技创业公司建立了深度合作。虽然目前的训练算法十分初级,但我认为它具有足够大的发展空间和前景,或许可成为继GPU之后的下一代训练范式。

最后,作为大数据项目的一名学生,我非常感谢有机会参与其中。作为一名硕士生,两年多短暂的科研时光转瞬即逝,我与各位博士学长相比成果并不多,但是大数据项目让我有足够的信息面对未来的科研之路,从大数据项目汲取的知识贯彻了我学习和研究的始终,可以说带领我走过了无数个人生的十字路口,真正使我受益一生!

编辑:于腾凯

校对:王欣

c00acdccbc696140b5179585c216dddb.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/357580.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

SV-7102T网络播放解码器

SV-7102T是一款IP网络广播终端,具有10/100M以太网接口,其接收网络的音频数据,支持48KHz采样,192Kbps的音频流播放,并提供两路立体声15W的功率输出.SV-7102T设备只有网络广播功能,是一款简单的带功放输出的网…

Wireshark中的TCP协议包分析

Wireshark可以跟踪网络协议的通讯过程,本节通过TCP协议,在了解Wireshark使用的基础上,重温TCP协议的通讯过程。 TCP(Transmission Control Protocol,传输控制协议)是一种面向连接的、可靠的、基于字节流的传…

如何使用手机安装JuiceSSH远程连接本地Linux服务器

⛳️ 推荐 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站。 文章目录 ⛳️ 推荐1. Linux安装cpolar2. 创建公网SSH连接地址3. JuiceSSH公网远程连接4. 固定连接SSH公网地址5. SSH固定地址…

PAT-Apat甲级题1003(python和c++实现)下

PTA | 1003 Emergency 书接上回,上次我们使用了python实现无向带权图与DFS算法的设计,本次我们将使用C对本题进行解答,思路和题目分析同上一节内容,本次我们将在上一节的基础上继续实现。 okok现在又是激动人心的手搓代码时间&a…

MySQL解决 恢复从备份点到灾难点之间数据恢复

CSDN 成就一亿技术人! 今天分享一期 mysql中 备份之后发生灾难造成数据丢失 那么如何恢复中间的数据呢? 数据库数据高于一切(任何数据是不能丢失的) CSDN 成就一亿技术人! 目录 1.准备测试数据库 2.备份数据库 观…

Visual Studio 2022 C++ 生成dll或so文件在windows或linux下用C#调用

背景 开发中我们基本使用windows系统比较快捷,但是部署的时候我们又希望使用linux比较便宜,硬件产商还仅提供了c sdk!苦了我们做二次开发的码农。 方案 需要确认一件事,目前c这门语言不是跨平台的 第一个问题【C生成dll在window…

C语言——深入理解指针1

目录 1. 内存和地址1.1 内存 2. 指针变量和地址2.1 取地址操作符2.2 指针变量和解引用操作符(*)2.2.1 指针变量2.2.2 如何拆解指针变量2.2.3 解引用操作符 2.3 指针的大小 3. 指针变量类型的意义3.1 指针的解引用3.2 指针 - 整数3.3 void*指针 4. const…

TypeScript 学习笔记(Day2)

「写在前面」 本文为 b 站黑马程序员 TypeScript 教程的学习笔记。本着自己学习、分享他人的态度,分享学习笔记,希望能对大家有所帮助。推荐先按顺序阅读往期内容: 1. TypeScript 学习笔记(Day1) 目录 3 TypeScript 常…

百度输入法往选字框里强塞广告

关注卢松松,会经常给你分享一些我的经验和观点。 国内几乎100%的输入法都有广告,只是你们没发现而已!!! 百度输入法居然在输入法键盘上推送广告,近日,博主阑夕 表示,V2EX论坛上有…

【webrtc】‘ninja.exe‘ 不是内部或外部命令,也不是可运行的程序及vs2019 重新构建m98

werbtc 就是用ninja.exe 来构建找到了自己以前构建的webrtc 原版 m98 【m98 】webrtc ninja 构建 、example、tests 及OWT- P2P 项目P2PMFC-E2E-m98G:\CDN\rtcCli\webrtc-checkout\src找到了自己的deptools的路径 deptools里确实没有ninja.exe D:\SOFT\depot_tools\third_party…

【LeetCode每日一题】56. 合并区间插入区间

一、判断区间是否重叠 力扣 252. 会议室 给定一个会议时间安排的数组 intervals ,每个会议时间都会包括开始和结束的时间 intervals[i] [starti, endi] ,请你判断一个人是否能够参加这里面的全部会议。 思路分析 因为一个人在同一时刻只能参加一个会…

《HTML 简易速速上手小册》第7章:HTML 多媒体与嵌入内容(2024 最新版)

文章目录 7.1 在HTML中嵌入视频和音频7.1.1 基础知识7.1.2 案例 1&#xff1a;嵌入视频文件7.1.3 案例 2&#xff1a;嵌入音频文件7.1.4 案例 3&#xff1a;创建一个视频和音频混合的播放列表 7.2 使用 <iframe> 嵌入外部内容7.2.1 基础知识7.2.2 案例 1&#xff1a;嵌入…

基于数字签名技术的挑战/响应式认证方式

挑战/响应式认证方式简便灵活&#xff0c;实现起来也比较容易。当网络需要验证用户身份时&#xff0c;客户端向服务器提出登录请求&#xff1b;当服务器接收到客户端的验证请求时&#xff0c;服务器端向客户端发送一个随机数&#xff0c;这就是这种认证方式的“冲击&#xff08…

ArcGIS Pro如何新建字段

无论是地图制作还是数据分析&#xff0c;字段的操作是必不可少的&#xff0c;在某些时候现有的字段不能满足需求还需要新建字段&#xff0c;这里为大家讲解一下在ArcGIS Pro中怎么新建字段&#xff0c;希望能对你有所帮助。 数据来源 教程所使用的数据是从水经微图中下载的水…

响应式商业服务专利版权申请 公司网站模板源码系统 带完整的搭建教程

随着互联网的普及和发展&#xff0c;企业对于建立专业、高效的网站的需求日益增长。为了满足这一市场需求&#xff0c;罗峰给大家分享一款响应式商业服务专利版权申请公司网站模板源码系统。该系统不仅功能强大&#xff0c;而且易于搭建和定制&#xff0c;极大地降低了企业建立…

单片机学习笔记---定时器计数器(含寄存器)工作原理介绍(详解篇2)

目录 T1工作在方式2时 T0工作在方式3时 四种工作方式的总结 定时计数器对输入信号的要求 定时计数器对的编程的一个要求 关于初值计算的问题 4种工作方式的最大定时时间的大小 关于编程方式的问题 实例分析 实例1 实例2 T1工作在方式2时 51单片机&#xff0c;有两个…

python3.8 安装缺少ssl、_ctypes模块解决办法

问题 安装pyhton3.8安装默认不依赖ssl 运行Flask项目时报错&#xff1a; Traceback (most recent call last):File "/usr/local/python3/bin/flask", line 8, in <module>sys.exit(main())File "/usr/local/python3/lib/python3.8/site-packages/flask…

C语言递归篇章+系统讲解分析+深入理解递归+根源进行讲解+进制转换+操作环境+实例剖析+万字+百张图片精细化讲解

递归的讲解系统分析 什么是递归 本质上就是一种算法 最简单递归 栈溢出 没有限制条件 导致无穷尽的调用自己 从而溢出 最后变成死递归 _________________________________________________________________________________________________________________________________…

SAP MM 采购发票输入税额,模拟时候发现没有税科目记账税额!

原因&#xff1a;行项目税额和抬头不一样导致&#xff0c;以下是调整过的截图&#xff0c;原来底下是J2

去中心化世界的奇迹:深度解析Web3

随着科技的飞速发展&#xff0c;我们正逐渐进入一个新的数字时代&#xff0c;而Web3技术正是这个时代的奇迹之一。本文将深入解析Web3&#xff0c;揭示它在构建去中心化世界方面的深远影响以及给我们带来的可能性。 什么是Web3&#xff1f; Web3是互联网的第三个时代&#xff…