优秀博士学位论文分享:通往稳健在线学习的“在线集成”理论与方法

优秀博士学位论文代表了各学科领域博士研究生研究成果的最高水平,本公众号近期将推出“优秀博士学位论文分享”系列文章,对人工智能领域2023年优秀博士学位论文进行介绍和分享,方便广大读者了解人工智能领域最前沿的研究进展。

“CCF博士学位论文激励计划”(原中国计算机学会优秀博士学位论文奖)是一项旨在表彰中国计算机科学领域博士研究生的杰出贡献的激励计划。该奖项的目的是促进学术研究的卓越性,并鼓励在计算机科学及其技术各子学科中产出高质量的博士论文。

本文主要介绍南京大学赵鹏博士的博士论文《通往稳健在线学习的“在线集成”理论与方法》,该论文针对如何建立对数据分布在线变化环境稳健的机器学习理论与方法这一机器学习研究的新挑战,提出“在线集成”学习框架,用以指导稳健在线学习的理论分析与算法设计。目前该论文已获得2023年“CCF博士学位论文激励计划”。此外,本文还对其导师周志华教授以及实验室进行了介绍,以方便读者了解更多相关信息。本文的作者为朱旺,审校为陆新颖和许东舟。

一、论文介绍

传统机器学习方法通常假设学习环境静态不变,然而真实世界环境往往动态变化,因此如何建立对数据分布在线变化稳健的机器学习理论与方法,成为机器学习研究的新挑战。针对这一挑战,论文提出“在线集成”学习框架,用以指导稳健在线学习的理论分析与算法。根据在线学习者与环境交互时收到反馈的不同,论文递进式地考虑在线学习中四类场景,并在该框架下分别提出了相应的在线集成方法。

图片

图1 在线集成框架示意图

图1为在线集成框架示意图。在线集成方法主要包含三部分:基学习器、结合学习器、调度方案。具体而言,整体算法根据调度方案维持多个基学习器,并基于调度方案通过结合学习器集成基学习器的预测作为最终的输出预测。除上述三个模块,还有一些额外规约,规定学习器是否使用乐观量、替代损失等高级的在线学习算法设计工具。

1. 完全信息在线学习

在学习者可以获取每轮在线函数梯度信息的情况下,论文提出了一种创新的在线集成方法。该方法通过合理构建基学习器—结合学习器结构,以自适应重用历史梯度信息,总体方法能够有效应对数据分布变化,并对不同问题实例具有问题相关的性能保障。理论证明了该方法达到了当前动态遗憾界的最优水平,并且通过实验验证了其有效性。

2. 凸赌博机在线学习

对学习者无法获得每轮在线函数梯度信息,只能获得单点/双点函数值信息的情况,论文通过构建替代损失函数以高效利用有限的信息反馈,设计了一种能够应用到赌博机反馈场景的在线集成方法。论文首次建立了凸赌博机在线学习问题的动态遗憾理论,该结果在双点反馈模型已达到理论最优,实验进一步验证了方法的有效性。

3. 带噪赌博机在线学习

对学习者无法获得每轮在线函数梯度信息,只能获得带噪声污染的函数值信息的情况,论文考察线性损失函数,通过最小二乘法估计未知参数并计算上置信界以选择每轮决策,通过周期性重启机制,赋予学习器应对环境动态变化的能力,并进一步设计双层赌博机的串行在线集成结构以自适应选取最优重启间隔。通过理论证明,本论文提出的方法在动态遗憾界上达到了当前最优水平,实验进一步验证了方法的有效性。

4. 决策控制在线学习

对决策控制在线学习这类存在状态转移,学习者决策会影响未来在线函数梯度及函数值信息的情况,论文考察在线非随机控制设定,通过分析问题性质,将其转化为具有记忆的在线凸优化问题,并设计新颖的正则化替代损失,实现了一种具有低转化损失的在线集成方法,从而有效处理决策控制过程中的记忆问题。论文首次建立了针对在线非随机控制问题的动态策略遗憾理论,并通过实验进一步验证了该方法的有效性。

二、指导老师——周志华教授简介

周志华教授是中国计算机科学和人工智能领域的著名学者,尤其在人工智能、机器学习、数据挖掘等领域有着广泛的研究和深厚的影响。他的主要研究方向有集成学习、进化学习、弱监督学习、不平衡学习等。周教授在研究领域内的国际顶级期刊和会议上发表论文两百余篇,总被引用六万余次。此外,他还编写了多部机器学习方面的著作,如《机器学习》、《机器学习理论引导》等,其中《机器学习》是学习AI入门的经典著作,为广大读者打开了人工智能的大门。目前,周志华教授担任南京大学人工智能学院院长,并在多个国际学术期刊和会议担任编委会成员或主席。若想了解更多关于周志华教授的信息,可以访问他的个人主页:https://cs.nju.edu.cn/zhouzh/index.htm

三、实验室介绍——LAMDA

LAMDA(Learning And Mining from DatA)实验室隶属于计算机软件新技术全国重点实验室,南京大学计算机科学与技术系和南京大学人工智能学院。该实验室位于南京大学仙林校区的计算机科学技术楼,由周志华教授担任负责人。LAMDA 实验室的研究领域包括机器学习、数据挖掘、模式识别、信息检索、演化计算、神经计算等众多热门领域。更多详细信息请访问LAMDA实验室主页:https://www.lamda.nju.edu.cn/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/566936.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

用于自动化机器陀螺仪传感器:XV7081BB

介绍一款用于自动化机器的数字输出型陀螺仪传感器XV7081BB。这款新推出的陀螺仪XV7081BB到底有什么魅力呢?我们可以用常用款用于智能割草机的XV7011BB作对比:XV7081BB提供16位或24位分辨率的角速率输出速率范围为400s。而XV7011BB采用16位角速度输出,检测范围为100…

软考 系统架构设计师系列知识点之大数据设计理论与实践(13)

接前一篇文章:软考 系统架构设计师系列知识点之大数据设计理论与实践(12) 所属章节: 第19章. 大数据架构设计理论与实践 第4节 Kappa架构 19.4.2 Kappa架构介绍 Kappa架构由Jay Kreps提出(Lambda由Storm之父Nayhan M…

48-PCIE转串口和并口电路设计

视频链接 PCIE转串口和并口电路设计01_哔哩哔哩_bilibili PCIe转串口和并口电路设计 1、PCIe转串并口电路设计基本介绍 2、PCIe转串口和并口的方案(京东) 2.1、PCIe转串口 2.1.1、ASIX (亚信)MCS9922-PCIe转2路RS232扩展卡 2.1.2、ASIX (亚信)MCS9900-PCIe转4路RS232扩展卡…

yield函数怎么理解?

目录 白话系列: 例子🌰: 什么叫暂停 yield和next搭配使用 例子🌰: 白话系列: 可以暂停,可以生成,next一个,yield一个 例子🌰: def generat…

如何使用 Meta AI 根据文本提示生成图片

在数字艺术和设计的世界中,AI 图片生成器已经成为了一种创新工具,它能够根据简短的文本描述来创造出令人惊叹的视觉作品。Meta AI 提供了这样一个平台,让用户可以轻松地将他们的想象变为现实。在本文中,我将指导您如何使用 Meta A…

C++——类和对象练习(日期类)

日期类 1. 构造函数和析构函数2. 拷贝构造和赋值运算符重载3. 运算符重载3.1 日期的比较3.2 日期加减天数3.3 日期减日期3.4 流插入和流提取 4. 取地址和const取地址重载5. 完整代码Date.hDate.c 对日期类进行一个完善,可以帮助我们理解六个默认成员函数&#xff0c…

图搜索算法详解:广度优先搜索与深度优先搜索的探索之旅

图搜索算法详解:广度优先搜索与深度优先搜索的探索之旅 1. 广度优先搜索(BFS)1.1 伪代码1.2 C语言实现 2. 深度优先搜索(DFS)2.1 伪代码2.2 C语言实现 3. 总结 图搜索算法是计算机科学中用于在图结构中查找路径的算法。…

手撕红黑树(map和set底层结构)(2)

[TOC]红黑树 一 红黑树概念 红黑树,是一种二叉搜索树,但在每个结点上增加一个存储位表示结点的颜色,可以是Red或Black。 通过对任何一条从根到叶子的路径上各个结点着色方式的限制,红黑树确保没有一条路径会比其他路径长出俩倍&…

54-摄像头DVP接口电路设计

视频链接 摄像头电路设计-DVP接口01_哔哩哔哩_bilibili 摄像头DVP接口电路设计 1、摄像头简介 1.1、Camera介绍 在各类信息中,图像含有最丰富的信息,作为机器视觉领域的核心部件,摄像头被广泛应用。 目前市面上最常用的摄像头为OV5640。…

【面试必备】Python 快问快答

什么是 Python,它有哪些主要特点 答:Python 是一种高级解释型编程语言,以简单易读著称。其主要特点包括动态类型、自动内存管理(垃圾回收)、丰富的标准库以及对多种编程范式(过程式、面向对象、函数式&…

内容营销ROI提升秘籍:Kompas.ai的高效内容分析

在内容营销的领域中,投资回报率(ROI)是衡量营销活动成效的关键指标。一个高ROI的内容营销策略不仅能够为企业带来直接的经济收益,还能够提升品牌价值和市场影响力。本文将深入探讨内容营销中ROI的重要性,介绍Kompas.ai…

【嵌入式】Arduino IDE + ESP32开发环境配置

一 背景说明 最近想捣鼓一下ESP32的集成芯片,比较了一下,选择Arduino IDE并添加ESP32支持库的方式来开发,下面记录一下安装过程以及安装过程中遇到的坑。 二 下载准备 【1】Arduino IDE ESP32支持一键安装包(非常推荐&#xff0…

canvas 学习

最近的项目涉及到 canvas 相关的知识,就在网站上找资源先大概了解一下,然后再细细研究。 看到了一篇 “canvas详细教程” 的资源,感觉十分不错,就分享给大家: canvas详细教程! ( 近1万字吐血总结)这期是潘潘整理的万…

C++入门(3)

文章目录 C入门auto同一行中定义多个变量auto不能推到的场景基于范围的for循环(C11)10. 指针空值nullptr(C11) C入门 auto auto:C11中,标准委员会赋予了auto全新的含义即:auto不再是一个存储类型指示符,而是作为一个新的类型指示…

基于ontape的备份与恢复实验

通过本文的备份恢复实验,我们可以深入了解ontape的使用方法和原理,包括如何进行完整备份、增量备份以及如何利用备份文件进行数据恢复。 1. 配置onconfig参数 通过修改onconfig参数文件,或使用onmode -wf命令,设置备份默认使用的…

pmp好考么?知道这些PMP一个多月拿下~

过来人想说的是PMP考试没那么难,学习也没那么复杂的,只要能好好学基础知识,积累实践案例,接着多做做题摸清题意套路,考试的时候就跟考科一似的。 尽管听上去描述的可能过于简单,但事实便是如是&#xff0c…

容器云平台运维的范围与架构设计新思潮

容器云平台运维的范围与架构设计 【导读】容器云平台有其独特的特点,不同于传统系统的运维。本文分享了作者对容器云平台运维范围和运维架构设计的思考与实践。 一、容器云平台运维范围 (一) 梳理要运维哪些内容 作为运维专家,…

被删除的照片和视频能找回吗?如何恢复手机删除的照片和视频?

手机里的照片和视频是我们记录生活的每一个瞬间,也是工作学习等场合经常用到的东西,一旦不慎丢失,将对我们造成很大损失。那么我们该如何恢复手机删除的照片和视频呢?通过掌握正确的恢复方法,能够最大程度地保护手机中…

【Leetcode笔记】501.二叉搜索树中的众数

文章目录 题目要求ACM 模式代码知识点 题目要求 给你一个含重复值的二叉搜索树(BST)的根节点 root ,找出并返回 BST 中的所有 众数(即,出现频率最高的元素)。 如果树中有不止一个众数,可以按 …

PDF文件去除文字水印

文章目录 0、背景1、准备工作2、查看是否是文字水印3、批量去除水印 0、背景 本文主题为去除PDF文件中的水印。源文件来自这里。防止丢失,我在这里做个记录,感谢原作者的付出,也欢迎大家关注原作者。 1、准备工作 下载Adobe Acrobat DC软件…