ICLR 2025|香港浸会大学可信机器学习和推理课题组专场

点击蓝字

7939c3b8c8efba062ec00b222d0cf817.jpeg

关注我们

AI TIME欢迎每一位AI爱好者的加入!

AITIME

01

ICLR 2025预讲会团队专场

c50400f776a1eacbc88cef5abb9c15e4.jpeg

AITIME

02

专场信息

01

Noisy Test-Time Adaptation in Vision-Language Models

讲者:曹晨涛,HKBU TMLR Group一年级博士生,目前关注基础模型的推理和可信机器学习研究。

时间:3月12日14:00-14:15

报告简介:我们的研究工作中引入了零样本噪声测试时适应(ZS-NTTA)任务。在现实场景中,模型常常会遇噪声样本,我们发现这种情况下现有的TTA方法表现不佳,甚至不如直接冻结模型后的性能。通过初步研究,我们发现在TTA过程中噪声数据的负面影响往往超过了干净数据的益处,而传统方法将分类和噪声检测任务混在一起,导致两者效果都受限。为此,我们设计了一个新框架,将分类器和噪声检测器解耦。我们提出了一种自适应噪声检测器(AdaND),保持模型主干和分类器冻结,利用冻结模型的输出作为伪标签来训练检测器,有效识别噪声样本。同时,我们在适应过程中加入高斯噪声,防止检测器将干净样本误判为噪声。这个方法不仅提升了在ZS-NTTA任务的效果,还增强了VLMs的零样本分布外检测能力。

论文地址:

https://openreview.net/pdf?id=iylpeTI0Ql

代码地址:

https://github.com/tmlr-group/ZS-NTTA

02

Rethinking LLM Unlearning Objectives: A Gradient Perspective and Go Beyond

讲者:王启舟,HKBU TMLR Group四年级博士生,主要关注基础模型微调和对齐问题

时间:3月12日14:15-14:30

报告简介:大语言模型需经过严格审核以识别潜在风险,例如版权侵犯和隐私泄露问题。一旦这些风险显现,及时更新模型以消除不良响应至关重要,从而确保模型使用合法且安全。这推动了近期对大语言模型遗忘技术的研究,其核心在于精准擦除目标不良知识的同时,不损害其他非目标响应的完整性。现有研究提出了多种遗忘目标,旨在无需完全重新训练即可实现大语言模型遗忘。然而,每种遗忘目标均具有独特属性,目前尚缺乏统一框架以系统理解其机制。为填补这一空白,我们提出了梯度效应(G-effect)的概念,从梯度视角量化遗忘目标对模型性能的影响。梯度效应的显著优势在于能够从实例、更新步长和模型本身等多个维度,全面解析不同遗忘目标的影响。据此,梯度效应为识别现有遗忘目标的缺陷提供了新视角,并进一步启发我们探索一系列缓解和改进现有方法的新方案。

论文地址:

https://openreview.net/pdf?id=huo8MqVH6t

代码地址:

https://github.com/tmlr-group/G-effect

03

Fast and Accurate Blind Flexible Docking

讲者:张子卓,HKBU TMLR Group一年级博士生,目前关注AI4Science和大模型对齐的研究。

时间:3月12日14:30-14:45

报告简介:分子对接预测配体小分子与目标蛋白质结合后的3D结构,在药物发现过程中发挥着重要作用。现有的深度学习分子对接方法主要关注于刚性分子对接任务,即假设目标蛋白质为刚性结构,在与小分子交互过程中结构不会发生变化。这一假设与真实场景中蛋白质-小分子交互行为不相符,因为蛋白质在这一交互过程中结构是动态变化的。我们的研究放松了刚性假设,针对更加现实的盲式灵活对接任务,蛋白质结构在对接过程中能动态变化的同时还需要预测结合位点。现有的灵活分子对接方法大多基于扩散模型以及多次采样,存在预测效率低和计算时间长的问题。为了实现高效灵活分子对接预测,我们的研究提出了一个基于回归预测的模型框架,同时预测小分子与蛋白质对接的口袋位点、配体分子结构和口袋部分蛋白质结构。该方法由于不需要前置的外部口袋位点预测和多次采样,实现了更加准确和快速的灵活分子对接预测。

论文地址:

https://openreview.net/pdf?id=iezDdA9oeB

代码地址:

https://github.com/tmlr-group/FABFlex

04

Hot-pluggable Federated Learning: briding General and Personalized FL via Dynamic Selection

讲者:沈磊,HKBU TMLR Group二年级博士生,目前主要关注联邦学习及大模型智能体。

时间:3月12日14:45-15:00

报告简介:个性化联邦学习通过假设客户端仅在本地遇到测试数据来实现高性能,但这并不适用于许多通用联邦学习的场景。在本研究中,我们从理论上证明,个性化模型可以通过一种名为选择性联邦学习(Selective FL, SFL)的新学习问题来增强通用联邦学习,该问题涉及优化个性化联邦学习和模型选择。然而,存储和选择整个模型需要不切实际的计算和通信成本。为了实际解决SFL问题,受模型组件的启发,我们设计了一个高效且有效的框架,名为热插拔联邦学习。具体来说,客户端基于共享的主干网络单独训练个性化的插件模块,并将其与插件标记一起上传到服务器的插件存储库中。在推理阶段,选择算法允许客户端从插件存储库中识别并检索合适的插件,以增强其在目标数据分布上的泛化性能。此外,我们在选择过程中提供了差分隐私保护,并提供了理论保证。此外,我们通过实验展示了热插拔联邦学习在解决其他实际联邦学习问题(如持续联邦学习)方面的显著潜力。

论文地址:

https://openreview.net/pdf?id=B8akWa62Da

代码地址:

https://github.com/tmlr-group/HPFL

AITIME

03

团队信息

香港浸会大学可信机器学习和推理课题组 (TMLR Group) 由多名青年教授、博士后研究员、博士生、访问博士生和研究助理共同组成,课题组隶属于理学院计算机系。课题组专攻可信基础模型、可信表征学习、基于因果推理的可信学习等相关的算法,理论和系统设计以及在自然科学上的应用,具体研究方向和相关成果详见本组Github (https://github.com/tmlr-group)。课题组由政府科研基金以及工业界科研基金资助,如香港研究资助局新进学者协作研究补助金和杰出青年学者计划,国家自然科学基金面上项目和青年项目,以及微软、英伟达、字节跳动、百度、阿里、腾讯等企业的科研基金。青年教授和资深研究员手把手带,GPU计算资源充足,长期招收多名博士后研究员、博士生、研究助理和研究实习生。此外,本组也欢迎自费的访问博士后研究员、博士生和研究助理申请,访问至少3-6个月,支持远程访问。有兴趣的同学请发送个人简历和初步研究计划到邮箱 (bhanml@comp.hkbu.edu.hk)。

AITIME

04

观看地址

f079df802151e63703dc928d26e939ff.jpeg

进入Bilibili直播间观看,

提问有可能会被选中由讲者回答!

欢迎关注AITIME论道 Bilibili 观看更多讲者回放!

AITIME

05

加入群聊

9e79db1533d72e75f686a20dbec2a172.png

添加"AI TIME小助手",发送“ICLR”,

将拉您进“AI TIME 交流群”!

往期精彩活动推荐

eeb8f669f8d25b8eaf89aa57c97dcb6c.jpeg

CVPR 2025结果出炉|一作讲者已开启招募,欢迎新老朋友来预讲会相聚!

 关于AI TIME 

AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。

迄今为止,AI TIME已经邀请了2000多位海内外讲者,举办了逾700场活动,超800万人次观看。

36016eb0e89ab91ad90578f9d1a9d4f9.png

我知道你 

在看

提出观点,表达想法,欢迎 

留言

96d1f6a8dfda669828ce49d77ed74a34.gif

点击 阅读原文 进入直播间!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/981985.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

ProfibusDP主站转ModbusTCP网关如何进行数据互换

ProfibusDP主站转ModbusTCP网关如何进行数据互换 在现代工业自动化领域,通信协议的多样性和复杂性不断增加。Profibus DP作为一种经典的现场总线标准,广泛应用于工业控制网络中;而Modbus TCP作为基于以太网的通信协议,因其简单易…

016.3月夏令营:数理类

016.3月夏令营:数理类: 中国人民大学统计学院: http://www.eeban.com/forum.php?modviewthread&tid386109 北京大学化学学院第一轮: http://www.eeban.com/forum.php?m ... 6026&extrapage%3D1 香港大学化学系夏令营&a…

使用IDEA如何隐藏文件或文件夹

选择file -> settings 选择Editor -> File Types ->Ignored Files and Folders (忽略文件和目录) 点击号就可以指定想要隐藏的文件或文件夹

通过微步API接口对单个IP进行查询

import requests import json# 微步API的URL和你的API密钥 API_URL "https://api.threatbook.cn/v3/ip/query" API_KEY "***" # 替换为你的微步API密钥 def query_threatbook(ip):"""查询微步API接口,判断IP是否为可疑"…

第七节:基于Winform框架的串口助手小项目---协议解析《C#编程》

介绍 目标 代码实现 private void serialPort1_DataReceived(object sender, SerialDataReceivedEventArgs e){if (isRxShow false) return;// 1,需要读取有效的数据 BytesToReadbyte[] dataTemp new byte[serialPort1.BytesToRead];serialPort1.Read(dataTemp,0,dataTemp.Le…

关于tresos Studio(EB)的MCAL配置之GPT

概念 GPT,全称General Purpose Timer,就是个通用定时器,取的名字奇怪了点。定时器是一定要的,要么提供给BSW去使用,要么提供给OS去使用。 配置 General GptDeinitApi控制接口Gpt_DeInit是否启用 GptEnableDisable…

C语言基础要素(011):增量、减量运算

让变量自身加一或减一是一种常用的运算,C语言提供了增量与减量运算符支持这些操作。 增量运算() 让变量自身加1,可以这样实现: int size 3; size size 1; // 语句执行后 size 值为 4 size 1; // 语句执行后 size 值为 5使…

深入探索WebGL:解锁网页3D图形的无限可能

深入探索WebGL:解锁网页3D图形的无限可能 引言 。WebGL,作为这一变革中的重要技术,正以其强大的功能和广泛的应用前景,吸引着越来越多的开发者和设计师的关注。本文将深入剖析WebGL的核心原理、关键技术、实践应用,并…

Python +Anaconda,DeepSeeK API入门小例子

一、环境搭建 1.安装pycharm 、anaconda,deepseek官网申请api key(不会的去百度,申请完了可以充值几块钱,现在官网应该没有免费token可以测试了) 2.anaconda创建虚拟环境 ,打开windows dos界面依次输入 命令:1) con…

股指期货的交易时间是几点到几点?

股指期货是一种金融衍生品,简单来说,就是以股票指数(比如沪深300指数)为标的的期货合约。投资者可以通过买卖这些合约来对冲风险或者投机。它的交易方式和股票有点像,但又有自己的特点。 股指期货的交易时间是什么时候…

推流项目的ffmpeg配置和流程重点总结一下

ffmpeg的初始化配置,在合成工作都是根据这个ffmpeg的配置来做的,是和成ts流还是flv,是推动远端还是保存到本地, FFmpeg 的核心数据结构,负责协调编码、封装和写入操作。它相当于推流的“总指挥”。 先来看一下ffmpeg的…

数字电子技术基础(二十四)——TTL门电路的高、低电平的输出特性曲线

目录 1 TTL门电路的特性曲线 1.1 高电平输出特性 1.1.2 高电平输出特性的实验过程 1.1.2 TTL门电路的输出特性的实验结果 1.2 低电平的输出特性 1 TTL门电路的特性曲线 1.1 高电平输出特性 1.1.2 高电平输出特性的实验过程 现在想要测试TTL门电路的输出特性&#xff0c…

盛铂科技SCP4000射频微波功率计与SPP5000系列脉冲峰值 USB功率计 区别

在射频(RF)和微波测试领域,快速、精准的功率测量是确保通信系统、雷达、卫星设备等高性能运行的核心需求。无论是连续波(CW)信号的稳定性测试,还是脉冲信号的瞬态功率分析,工程师都需要轻量化、…

GCC RISCV 后端 -- cc1 入口

GCC编译工具链中的 gcc 可执行程序,实际上是个驱动程序(Driver),其根据输入的参数,然后调用其它不同的程序,对输入文件进行处理,包括编译、链接等。可以通过以下命令查看: gcc -v h…

C++第二十讲:C++11

C第二十讲:C11 1.列表初始化1.1C98时的{}初始化1.2C11的新规{}初始化1.3initializer_list初始化 2.右值引用和移动语义2.1右值引用2.1.1左值和右值2.1.2左值引用和右值引用2.1.3引用延长声明周期2.1.4左值和右值的参数匹配 2.2右值引用和移动语义的使用2.2.1移动构造…

Finebi_求组内占比和组内累计占比

需求:原始数据结构如下,要求各每个月的各产品销量占比,至每月的各产品销量累计占比 实现步骤: ①维度拖入日期,按年月分组 ②各产品销量占比DEF(SUM_AGG(${产品销量表_销量&…

PE文件结构详解(DOS头/NT头/节表/导入表)使用010 Editor手动解析notepad++.exe的PE结构

一:DOS部分 DOS部分分为DOS MZ文件头和DOS块,其中DOS MZ头实际是一个64位的IMAGE_DOS——HEADER结构体。 DOS MZ头部结构体的内容如下,我们所需要关注的是前面两个字节(e_magic)和后面四个字节(e_lfanew&a…

自由学习记录(41)

代理服务器的核心功能是在客户端(用户设备)和目标服务器(网站/资源服务器)之间充当“中介”,具体过程如下: 代理服务器的工作流程 当客户端希望访问某个网站(比如 example.com)时&…

学习工具的一天之(burp)

第一呢一定是先下载 【Java环境】:Java Downloads | Oracle 下来是burp的下载 Download Burp Suite Community Edition - PortSwigger 【下载方法二】关注的一个博主 【BurpSuite 安装激活使用详细上手教程 web安全测试工具】https://www.bilibili.com/video/BV…

大模型gpt结合drawio绘制流程图

draw下载地址 根据不同操作系统选择不同的安装 截图给gpt 并让他生成drawio格式的,选上推理 在本地将生成的内容保存为xml格式 使用drawio打开 保存的xml文件 只能说效果一般。