SleepFM:利用对比学习预训练的多模态“睡眠”基础模型

大模型技术论文不断,每个月总会新增上千篇。本专栏精选论文重点解读,主题还是围绕着行业实践和工程量产。若在阅读过程中有些知识点存在盲区,可以回到如何优雅的谈论大模型重新阅读。另外斯坦福2024人工智能报告解读为通识性读物。若对于如果构建生成级别的AI架构则可以关注AI架构设计。技术宅麻烦死磕LLM背后的基础模型。

SleepFM

睡眠医学是一个关键领域,涉及监测和评估生理信号以便于诊断睡眠障碍和了解睡眠模式。多导睡眠图 (PSG)等技术可记录睡眠期间的大脑、心脏和呼吸活动,从而反映一个人的睡眠健康状况。这些数据对于对睡眠阶段分类和识别睡眠障碍至关重要。

PSG 通常包括脑电图 (EEG)、眼电图 (EOG)、肌电图 (EMG)、心电图 (ECG) 和呼吸通道。每种模式都提供了独特的视角:大脑活动信号 (BAS) 测量大脑功能,心电图监测心律,呼吸传感器量化呼吸模式,共同提供睡眠健康的全面评估。

手动分析涉及由训练有素的技术人员进行目视检查,费时费力,而且容易出错。这种传统方法面临着重大挑战,尤其是随着睡眠数据量的增加。因此迫切需要能高效和准确的多种睡眠数据的融合自动化分析技术。

目前睡眠数据分析方法主要依赖于监督深度学习模型。这些模型在自动化睡眠分期和睡眠呼吸障碍等方面的确斩获不少。然而大多数现有方法依赖于来自比较狭窄的语料,并没有利用PSG提供的全部数据。

此外,虽然对比学习在其他领域取得了成功,但它在整合 BAS、ECG 和呼吸信号进行睡眠分析方面的应用仍未得到充分探索。

来自斯坦福大学和丹麦技术大学的研究人员推出SleepFM,这是一种用于睡眠分析的开创性多模态基础模型。该模型利用了来自14,000多名参与者的庞大多模态睡眠记录数据集,这些数据在1999年至2020年间在斯坦福睡眠诊所收集的总计超过100,000小时的睡眠数据。SleepFM 利用对比学习方法来整合大脑活动、心电图和呼吸信号。这种集成使模型能够捕获全面的生理表征,从而显着提高睡眠分析的准确性。

对比学习

对比学习(Contrastive learning)代表了机器学习方法的范式(paradigm)转变,特别是在处理未标记数据集的场景。这种方法的核心是基于数据的相似性和不同性对数据进行二元分类。该框架有效地将相似的实例放置在潜在空间中,同时确保不同类别进行分离。它在具体的表现就是相似性的数据应该在学到的嵌入(Embedding)空间保持紧密对齐,而那些不同的数据则应该相离更远。

对比学习最重要的是数据增强,此步骤通过各种转换来生成一系列数据不同维度的表示方法。包括裁剪、翻转、旋转和其他扰动,有助于扩大数据集的多样性。关键还是要增强数据的异质性,从而将模型引入相同实例的多个视角。

举个例子,将苹果的各个维度的照片输入模型,告诉模型这都是苹果

架构详解

SleepFM采用三种一维卷积神经网络 (CNN) 从每种模态(BAS、ECG 和呼吸信号)生成嵌入。这些模型的架构基于为对 ECG 测量进行分类而开发的 1D CNN。

每个 CNN 都经过定制以处理其各自模式的特定特征:10 个用于 BAS 的通道,2个用于 ECG 的通道,7个用于呼吸通道。引入了一种Leave-One-Out的技术,在捕捉不同生理信号之间的协同关系明显优于标准的成对的对比学习。

在这次的项目中,研究人员探索了两种用于跨模态学习联合表示的对比学习CL的框架进行模型的预训练。一种为标准成对的 CL,另外一种为Leave-One-Out CL(上图)。

在这里有三种模态,也就是在同一时间有三个相匹配的输入。Leave-One-Out构建对比学习样本时,将其中的两个输入与余下的输入构成样本对,如此可以从一个片段构建出三个样本对。

关键的指导思想将来自不同模态的正匹配对在Embedding空间中拉近,同时拉开负匹配对。这里正匹配来自不同模态的经过时间对齐的30秒数据块。其余的所有都被视为负匹配对。

按照睡眠研究中使用的标准剪辑持续时间,将所有参与者的总睡眠持续时间细分为连续的 30 秒剪辑。然后将数据集重新采样为 256Hz,以标准化所有参与者的采样率。此外,专业的睡眠技术人员为睡眠阶段和 SDB的每个剪辑贴上了标签。

模型预训练涉及使用设置为0.001的初始学习率和0.9的动量来最小化随机梯度下降的对比损失。学习率每5个周期衰减10倍。可训练的温度参数初始化为0。训练最多跨越20个周期,并根据验证损失提前停止,采用 32 个批处理大小,并在每个周期验证检查点以确保稳健的正则化。

通过这种自监督方法完成预训练后,利用学习到的模态编码器为训练、验证和测试集生成Embedding。随后利用Embeding来进行分类器训练。

大白话就是这里其实重点在于多模态的对齐,然后使用这个基础模型再去进行睡眠阶段分类和 SDB事件检测的模型训练。下图为利用SleepFM去做下游任务的表现。

小编认为该模型的成功主要归功于它能够学习丰富的多模态生理数据表示,这对于准确的睡眠分析至关重要。

而且SleepFM在人口统计学属性分类方面也表现出色,在从30秒的生理数据片段中预测年龄和性别方面表现出很高的准确性。该模型在0-18岁、18-35岁、35-50岁和50+年龄组的AUROC分别为0.982、0.852、0.784和0.915。对于性别分类,AUROC为0.850,明显优于基线模型。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/667936.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Go微服务: 封装nacos-sdk-go的v2版本与应用

概述 基于前文:https://active.blog.csdn.net/article/details/139213323我们基于此SDK提供的API封装一个公共方法来用于生产环境 封装 nacos-sdk-go 我们封装一个 nacos.go 文件, 这个是通用的工具库 package commonimport ("fmt""github.com/nac…

如何查看谁连接到了你的Wi-Fi网络?这里提供几种方法或工具

序言 你知道谁连接到你路由器的Wi-Fi网络吗?查看从路由器或计算机连接到Wi-Fi网络的设备列表,找出答案。 请记住,现在很多设备都可以连接到了你的Wi-Fi,该名单包括笔记本电脑、智能手机、平板电脑、智能电视、机顶盒、游戏机、Wi-Fi打印机等。 使用GlassWire Pro查看连接…

蒙自源六一童趣献礼:纯真餐单,唤醒你的童年味蕾

当岁月的车轮滚滚向前,我们总会怀念那些逝去的时光,尤其是那段纯真无瑕的童年。当六一儿童节来临,心底的那份童趣与回忆总会被轻轻触动。从5月25日起,蒙自源旗下各大门店为所有小朋友,以及那些心怀童真的大人们&#x…

Mac vm虚拟机激活版:VMware Fusion Pro for Mac支持Monterey 1

相信之前使用过Win版系统的朋友们对这款VMware Fusion Pro for Mac应该都不会陌生,这款软件以其强大的功能和适配能力广受用户的好评,在Mac端也同样是一款最受用户欢迎之一的虚拟机软件,VM虚拟机mac版可以让您能够轻松的在Apple的macOS和Mac的…

华为交换机、路由器配置查询、用户界面常见配置及安全加固

华为交换机、路由器配置查询、用户界面常见配置及安全加固。 一、查询命令 1.常用的查询命令 查看当前生效的配置信息: display current-configuration //正在生效的配置,默认参数不显示。查看当前视图下生效的配置信息: display this //常…

数字IC基础:主要的FPGA厂商

相关阅读 数字IC基础https://blog.csdn.net/weixin_45791458/category_12365795.html?spm1001.2014.3001.5482 Xilinx(现已被AMD收购) Xilinx, 成立于1984年,是FPGA(现场可编程门阵列)技术的创始者和市场领导者。该公…

Mac下载Homebrew

通过command空格搜索终端打开 直接输入 /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)" 然后输入电脑密码 然后直接回车等待安装完成 注意⚠️:如果出现报错/opt/homebrew/bin is not in your PATH…

python操作mongodb底层封装并验证pymongo是否应该关闭连接

一、pymongo简介 github地址:https://github.com/mongodb/mongo-python-driver mymongo安装命令:pip install pymongo4.7.2 mymongo接口文档:PyMongo 4.7.2 Documentation PyMongo发行版包含Python与MongoDB数据库交互的工具。bson包是用…

【设计模式深度剖析】【1】【行为型】【模板方法模式】| 以烹饪过程为例加深理解

👈️上一篇:结构型设计模式对比 文章目录 模板方法模式定义英文原话直译如何理解呢? 2个角色类图代码示例 应用优点缺点使用场景 示例解析:以烹饪过程为例类图代码示例 模板方法模式 模板方法模式(Template Method Pattern&…

生信分析进阶4 - 比对结果的FLAG和CIGAR信息含义与BAM文件指定区域提取

BAM文件时存储比对数据的常用格式,可用于短reads和长reads数据。BAM是二进制压缩格式,SAM文件为其纯文本格式,CRAM为BAM的高压缩格式,IO效率相比于BAM略差,但是占用存储空间更小。 1. BAM文件的比对信息 BAM的核心信…

软件测试期末复习

第四章 边界黑盒测试续 4.3边界值设计方法 1.边界值设计方法:故障往往出现在定义域或边界值上。通常边界值分析法是作为对等价类划分法的补充。其测试用例来自等价类的边界。是对输入或输出的边界值进行测试的一种黑盒测试方法。 2.边界值分析法和等价类划分法的…

在Visual Studio2022中同一个项目里写作业,有多个cpp文件会报错

为了省事,在同一个项目里写很多个题目,结果只有一个cpp文件时没出错,写了2个cpp文件再想运行时就出错了; 将不相关的cpp文件移出去 在源文件中对其点击右键,找到“从项目中排除”; 结果如图,剩…

网络原理-三

一、连接管理 建立连接,断开连接 建立连接,TCP有连接的. 客户端执行 socket new Socket(SeverIP,severPort); -> 这个操作就是在建立连接. 上述只是调用socket api,真正建立连接的过程,实在操作系统内核完成的. 内核是怎样完成上述的 " 建立连接 "过程的…

云硬盘的基准性能测试场景

参考来源: 深入浅出云计算-05 | 云硬盘:云上IO到底给不给力 云硬盘的性能等级 当下的云硬盘经过了多次的软硬件迭代,尤其是SSD的迅速发展,吞吐量和随机读写能力等各项性能指标都已经不再是问题了。在现代云计算中,已…

数仓建模—ChatETL

数仓建模—ChatETL 前面我们介绍过ChatBI ,就是让用户通过自然语言对话的方式可以获取到自己想要的数据,然后通过合适的报表展示出来,其实我们可以将其理解为应用层面的技术创新,但是这个实现的前提就是我们底层已经有加工好的大量的数据模型数据表,并且有完善的元数据建…

“论SOA在企业集成架构设计中的应用”必过模板,突击2024软考高项论文

考题部分 企业应用集成(Enterprise Application Integration, EAI)是每个企业都必须要面对的实际问题。面向服务的企业应用集成是一种基于面向服务体系结构(Service-OrientedArchitecture,SOA)的新型企业应用集成技术,强调将企业和组织内部的资源和业务功…

【自动化运维】不要相信人,把所有的东西都交给机器去处理

不积跬步,无以至千里;不积小流,无以成江海。 大家好,我是闲鹤,十多年开发、架构经验,先后在华为、迅雷服役过,也在高校从事教学3年;目前已创业了7年多,主要从事物联网/车…

【网络安全的神秘世界】MySQL

🌝博客主页:泥菩萨 💖专栏:Linux探索之旅 | 网络安全的神秘世界 | 专接本 MySQL MySQL 教程 | 菜鸟教程 (runoob.com) 什么是数据库 数据库(Database)是按照数据结构来组织、存储和管理数据的仓库 在do…

COLING 2024: 复旦发布AoR,层级聚合推理突破大模型复杂推理上限

“三个臭皮匠,顶个诸葛亮?” “一个模型不行,那就再堆一个?” 过去当我们在处理复杂任务的时候,往往会考虑集成策略(Ensembling Strategy),通过多个模型投票的方式,选出…

[手游] Florence逝去的爱弗洛伦斯

图片处理工具箱Hummingbird : Hummingbird使用智能压缩技术来减少文件的大小,支持:jpg、png、webp、svg、gif、gif、css、js、html、mp4、mov,可以设置压缩的同时等比例缩放图片或视频的尺寸。可以拖放文件夹压缩,一次最多可处理1…