张岳教授:语言模型推理与泛化研究 | ICLR 2025 特邀报告与团队专场

点击蓝字

b0b87b54cda1c085497c1740cfde87ca.jpeg

关注我们

AI TIME欢迎每一位AI爱好者的加入!

AITIME

01

ICLR 2025预讲会特邀报告

cb1c34310eabadc24aef7b483bc9c767.jpeg

AITIME

02

ICLR 2025预讲会西湖大学张岳老师实验室专场

01

AI生成文本的自动化检测

Glimpse: Enabling White-Box Methods to Use Proprietary Models for Zero-Shot LLM-Generated Text Detection

鲍光胜,张岳实验室博士生(2022级)

时间:3月4日10:00-10:15

简介:

先进的大型语言模型能够生成几乎与人类撰写的文本无法区分的内容,这使得自动、准确地检测AI生成文本变得非常重要。然而,目前的检测技术面临一个很大的挑战:白盒检测方法检测能力很强,但由于方法需要使用模型的预测分布,只能使用能力相对较弱的开源模型;而黑盒检测方法虽然能使用能力较强的私有模型(如gpt-4),但因为这类方法本身的缺陷,其检测能力并不强。由于私有模型只能通过API访问,无法提供完整的预测分布或内部嵌入,使得让白盒方法使用私有模型实现强强联手看起来似乎不可能。为解决这一难题,我们提出了Glimpse,一种概率分布估计方法,从API返回的部分观察中,预测恢复完整分布,从而成功地将多种白盒方法扩展到最新的私有模型上。实验表明,Glimpse结合Fast-DetectGPT方法和GPT-3.5模型,在五个最新大模型生成的语料上,实现了约95%的检测准确率,相较于开源模型基线将检测准确率相对提高了51%。我们的研究表明最新的大模型可以有效检测自己的输出,展示先进的大模型本身就是抵御它们自身风险的最佳护盾。

论文地址:

https://arxiv.org/pdf/2412.11506

代码地址:

https://github.com/baoguangsheng/glimpse

图片

02

CycleResearcher: 通过自动化审稿提升自动化研究

CycleResearcher: Improving Automated Research via Automated Review

翁诣轩,张岳实验室访问学生

时间:3月4日10:15-10:30

简介:

本文探讨了利用开源大语言模型(LLMs)实现科研全流程自动化的可行性,提出了一种结合研究生成与自动化评审的迭代强化学习框架。该框架包含两个核心组件:CycleResearcher作为策略模型,负责文献综述、实验设计及论文撰写;CycleReviewer作为奖励模型,模拟同行评审过程,通过强化学习提供反馈以优化研究输出。研究构建了Review-5k(包含论文评审数据)和Research-14k(涵盖机器学习领域论文全文及大纲)两个新数据集,支持模型训练与评估。实验结果表明,CycleReviewer在预测论文得分上较个体人类评审者平均绝对误差(MAE)降低26.89%,显示出其在评审支持中的潜力;CycleResearcher生成的论文在模拟评审中得分为5.36,较会议录用论文(5.69)仍有改进空间。研究还设计了AI生成内容检测工具(准确率超95%),并强调伦理规范,倡导透明披露AI参与以维护学术诚信。该工作为AI驱动的自动化科研提供了新思路,同时兼顾了技术创新与学术责任。 

03

大语言模型的个性化对齐

Personality Alignment of Large Language Models 

朱敏郡,张岳实验室博士生(2023级)

时间:3月4日10:30-10:45

简介:

本文提出了一种名为“人格对齐”的创新方法,旨在解决大型语言模型(LLMs)在个性化交互中的局限性。传统模型通常基于普世人类价值观对齐,而本研究强调从个体差异出发,通过心理学测评工具量化用户特性。研究者构建了涵盖32万真实用户的PAPI数据集,包含正面的“大五人格”(开放性、尽责性、外向性、宜人性、神经质)和负面的“黑暗三联征”(马基雅维利主义、自恋、心理变态)双重评估体系,首次实现了语言模型在健康与病态人格维度的全面校准。针对个性化数据稀缺和计算效率挑战,团队开发了无需训练的“人格激活搜索”(PAS)方法。该方法通过识别关键注意力头并定向调整激活向量,在保持模型参数不变的前提下,仅需传统方法1/6的优化时间即可实现精准对齐。实验表明,PAS在Llama-3等模型上的对齐效果显著优于DPO、PPO等主流方法,甚至在部分指标上超越GPT-4。研究还揭示了人格对齐对复杂推理能力的正向影响,如提升尽责性可使模型数学解题准确率提高0.68个百分点。这项工作为构建真正个性化的AI系统提供了新范式。

论文地址:

https://openreview.net/pdf?id=0DZEs8NpUH

代码地址:

https://github.com/zhu-minjun/PAlign

图片

04

NovelQA:对超过20万个tokens的文档进行基准问答

NovelQA: Benchmarking Question Answering on Documents Exceeding 200K Tokens

王存翔,张岳实验室2019级博士生

时间:3月4日10:45-11:00

简介:

为了引导和评测大模型的这种能力,我们基于几十本长篇英文小说,标注了几千条需要大模型从小说各个角落获取信息并进行复杂推理的问答题,比如“主教请JearValiean吃饭的时候桌上点了几根蜡烛”这种给别人转述故事的时候人家追问100次你都不会讲到的细节,还有比如“马德兰市长在小说开头马车下救的人在书中间跟Jean Valiean的名字有什么关系”这种转了很多章节和人物关系的问题。并且为了防止数据的泄漏,我们只在网上开源题目,而不开源答案,而让参与者通过CodaBench提交他们的回答并且算分。

论文地址:

https://openreview.net/forum?id=uMEsKEiB7J

图片

AITIME

03

观看地址

70ae462b78c470a91acc9a631c460d2c.jpeg

进入Bilibili直播间观看,

提问有可能会被选中由讲者回答!

欢迎关注AITIME论道 Bilibili 观看更多讲者回放!

AITIME

04

加入群聊

f42bfc1e265cebe5af280fbb6afa647a.png

添加"AI TIME小助手",发送“ICLR”,

将拉您进“AI TIME 交流群”!

往期精彩活动推荐

6241d9d879219386db6358c7549a7278.jpeg

CVPR 2025结果出炉|一作讲者已开启招募,欢迎新老朋友来预讲会相聚!

 关于AI TIME 

AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。

迄今为止,AI TIME已经邀请了2000多位海内外讲者,举办了逾700场活动,超800万人次观看。

2f6892ffa9f5e58cd998627480173000.png

我知道你 

在看

提出观点,表达想法,欢迎 

留言

96cf9d0cb14ab06e51c15ffad2903d16.gif

点击 阅读原文 进入直播间!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/981069.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Qt显示一个hello world

一、显示思路 思路一:通过图形化方式,界面上创建出一个控件显示。 思路二:通过编写C代码在界面上创建控件显示。 二、思路一实现 点开 Froms 的 widget.ui,拖拽 label 控件,显示 hello world 即可。 qmake 基于 .…

Qt基础入门-详解

前言 qt之路正式开启 💓 个人主页:普通young man-CSDN博客 ⏩ 文章专栏:C_普通young man的博客-CSDN博客 ⏩ 本人giee: 普通小青年 (pu-tong-young-man) - Gitee.com 若有问题 评论区见📝 🎉欢迎大家点赞&#x1f44…

React Native从入门到进阶详解

React Native知识框架从入门到进阶的问题。首先需要结合我搜索到的资料来整理出结构化的内容。证据中有多本书籍和文章,可能会涉及不同的章节和重点,需要仔细梳理。 首先,根据邱鹏源的《React Native精解与实战》将知识分为入门和进阶两大部分…

win本地vscode通过代理远程链接linux服务器

时间:2025.2.28 1. win本地下载nmap.exe nmap官网 https://nmap.org/或者 https://nmap.org/download#windows下载win版本并安装。 2. vscode插件Remote-SSH 插件下载Remote-SSH 3. 配置 按照图中顺序配置ssh 1.点击左侧工具栏的“小电视”图标 2.点击ssh的…

MIT 6.S184 流匹配与扩散模型公开课

课程简介 MIT 2025年开设的关于流匹配算法与扩散模型的新课,6.S184: Generative AI with Stochastic Differential Equations(生成式人工智能与随机微分方程),授课教师是Peter Holderrieth和Ezrah Erives。 生成式AI是一种能创建…

SQL server配置ODBC数据源(本地和服务器)

本地配置 1. 控制面板中找到系统ODBC数据源(打开控制面板直接搜) 2. 选择“系统DSN”,点击“添加” 3. 选择“SQL server” 4. 名称和描述自己填,服务器选择本机设备名称 5. 选择ID和密码验证,并填写本地SQL server登…

JVM线程分析详解

java线程状态: 初始(NEW):新创建了一个线程对象,但还没有调用start()方法。运行(RUNNABLE):Java线程中将就绪(ready)和运行中(running)两种状态笼统的称为“运行”。 线程对象创建…

Redis - 高可用实现方案解析:主从复制与哨兵监控

文章目录 Pre概述Redis 高可用实现方案一、主从复制机制1.1 全量同步流程1.2 增量同步(PSYNC)流程 二、哨兵监控机制2.1 故障转移时序流程 三、方案对比与选型建议四、生产环境实践建议 Pre Redis-入门到精通 Redis进阶系列 Redis进阶 - Redis主从工作…

栈和队列的模拟实现

文章目录 一. 回顾栈和队列二. stack的模拟实现stack.hstack.cpp 三. queue的模拟实现queue.htest.cpp 四. 了解dequeuevector和list都有各自的缺陷deque 总结 一. 回顾栈和队列 回顾一下栈和队列 栈:stack:后进先出 _ 队列:queue&#xf…

【Linux】之【Bug】VMware 虚拟机开机 一直卡在黑屏左上角下划线闪烁界面

解决 参考: 解决Ubuntu20.04 开机黑屏光标闪烁进不去系统 Centos根目录100%解决思路 当前界面 ctrlaltf3-f6 暂时进入终端界面 df -h 查看发现根目录 磁盘空间已满 执行命令 查看当前目录占用内存明细 sudo du -h -x --max-depth1清理无用的大内存文件 或者安装…

【uniapp】离线打包uniapp为apk详细步骤

先看效果 登录页面的图片由于来自于图鸟官网,这里没有显示。 离线打包uniapp为apk 运行环境:华为mate30,已经升级为鸿蒙系统。 参考文档 https://blog.csdn.net/xiaoyao_studio/article/details/144076431 https://juejin.cn/post/739…

【通俗讲解电子电路】——从零开始理解生活中的电路(一)

导言:电子电路为什么重要? ——看不见的“魔法”,如何驱动你的生活? 清晨,当你的手机闹钟响起时,你可能不会想到,是电子电路在精准控制着时间的跳动;当你用微波炉加热早餐时&#…

Octave3D 关卡设计插件

课程参考链接 这位大佬有在视频合集中有详细的讲解,个人体验过,感觉功能很强大 https://www.bilibili.com/video/BV1Kq4y1C72P/?share_sourcecopy_web&vd_source0a41d8122353e3e841ae0a39908c2181 Prefab资源管理 第一步 在场景中创建一个空物体…

通过多线程分别获取高分辨率和低分辨率的H264码流

目录 一.RV1126 VI采集摄像头数据并同时获取高分辨率码流和低分辨率码流流程 ​编辑 1.1初始化VI模块: 1.2初始化RGA模块: 1.3初始化高分辨率VENC编码器、 低分辨率VENC编码器: 1.4 VI绑定高分辨率VENC编码器,VI绑定RGA模块…

【Python 数据结构 1.零基础复习】

目录 一、输入与输出 1.输入 2.格式化输出 二、数字与变量 1.字符串 & 整型 2.字符串 & 整型 & 浮点型 3.变量 练习 2235. 两整数相加 三、运算与操作 1.四则运算 练习 2769. 找出最大的可达成数字 3.取整与取余 练习 2651. 计算列车到站时间 ​编辑 四、真与假 1…

21. 构造二叉树(卡码网)

21. 构造二叉树 find()方法 在Python中,str.find(sub[, start[, end]]) 方法用于查找子字符串 sub 在字符串中首次出现的位置,返回其起始索引。如果未找到,返回 -1 class Tree:def __init__(self,valNone,leftNone,r…

RocketMQ定时/延时消息实现机制

RocketMQ 的延迟消息是其核心特性之一,允许消息在指定延迟时间后才被消费者消费。 定时消息生命周期 一、延迟消息的核心机制 RocketMQ(5.0之前) 不支持任意时间精度的延迟,而是通过预定义的 延迟级别(Delay Level&a…

【编程题】7-3 树的同构

7-3 树的同构 1 题目原文2 思路解析3 代码实现4 总结 1 题目原文 题目链接:7-3 树的同构 给定两棵树 T 1 T_1 T1​ 和 T 2 T_2 T2​​。如果 T 1 T_1 T1​ 可以通过若干次左右孩子互换就变成 T 2 T_2 T2​,则我们称两棵树是“同构”的。例如图 1 1 …

WebP2P技术在嵌入式设备中的应用:EasyRTC音视频通话SDK如何实现高效通信?

在数字化时代,实时通信技术(RTC)与人工智能(AI)的融合正在重塑各个行业的交互方式。从在线教育到远程医疗,从社交娱乐到企业协作,RTC的应用场景不断拓展。然而,传统的RTC解决方案往往…

【前端】前端设计中的响应式设计详解

文章目录 前言一、响应式设计的定义与作用二、响应式设计的原则三、响应式设计的实现四、响应式设计的最佳实践总结 前言 在当今数字化时代,网站和应用程序需要适应各种设备,从桌面电脑到平板电脑和手机。响应式设计应运而生,成为一种可以适…