多模态融合 + 慢病精准预测

多模态融合 +慢病精准预测

    • 慢病预测算法拆解
        • 子解法1:多模态数据集成
        • 子解法2:实时数据处理与更新
        • 子解法3:采用大型语言多模态模型(LLMMs)进行深度学习分析
      • 慢病预测更多模态

 


论文:https://arxiv.org/pdf/2406.18087

演示:https://www.youtube.com/watch?v=oqmL9DEDFgA

传统的慢性病诊断涉及与医生面对面的咨询以识别疾病。然而,缺乏研究集中在使用临床笔记和血液测试值预测和开发应用系统。

我们收集了台湾医院数据库2017至2021年的五年电子健康记录(EHRs)作为人工智能数据库。

开发了一个基于大型语言多模态模型(LLMMs)的慢性病预测平台。

这个平台可以与前端网页和移动应用集成,还能连接到医院的后端数据库,提供实时的风险评估诊断。

我们使用多种模态数据,来处理常见的慢性疾病,如糖尿病、心脏病和高血压,进行多模态模型训练。

  • 临床笔记:这些文本数据包含医生的详细观察和患者的病历描述,能够提供患者的历史病情和症状信息。
  • 实验室测试结果:包括血液检测等生化指标,这些是量化数据,提供了关于患者当前健康状况的重要信息。
  • 历史电子健康记录(EHR):可能包括患者过去的医疗记录、药物使用记录、手术历史等,这些数据有助于模型理解患者的整体健康轨迹。

以及使用了大模型,如BERT 、BiomedBERT、Flan-T5-large-770M 和 GPT-2 作为文本特征提取器。

  • 在高血压的预测中,所有模型的表现都相对较低,其中BERT和BiomedBERT的精确度和F1分数均为0.35和0.32,而GPT-2的表现最差,精确度为0.29,F1分数为0.25。

  • 对于心脏病的预测,GPT-2表现最好,精确度为0.81,召回率为0.85,F1分数为0.83。BiomedBERT也表现良好,其精确度、召回率和F1分数分别为0.76、0.75和0.75。

  • 在糖尿病分类上,GPT-2与BiomedBERT表现较好,GPT-2的精确度为0.70,召回率为0.71,F1分数也为0.70;而BiomedBERT的召回率达到0.72,F1分数为0.67。

  • 结论是,在临床记录,文本特征提取器,每个大模型在不同慢病上,效果都不同。最好是专门子领域微调过的。

接下来,我们将单一模态的临床笔记作为输入到LLMMs中,提取文本特征嵌入,并使用注意力模块将它们融合,用于最终的预测任务。

  • 数据收集与预处理:从EHR和实验室测试数据开始,收集必要的信息。
  • AI训练数据库的建立:包括数据清洗和医疗团队的注解,以确保数据的质量和适用性。
  • 大型语言多模态模型(LLMMs):展示了如何使用LLMMs来从处理过的数据中提取特征,并用于预测如早期糖尿病和其他慢性疾病。

在这里插入图片描述
Web平台的四个主要界面:

  • (a) 疾病风险界面:展示患者的糖尿病、高血压和心脏病风险评估。
  • (b) 早期疾病预测界面:展示患者未来90、180、270和360天的糖尿病风险。
  • © SHAP值解释界面:使用SHAP值来标识临床笔记中的关键风险因素。
  • (d) 实验室数据提交界面:允许医生上传患者的血液测试数据。

慢病预测算法拆解

开发一个能够实时预测和警报慢性病风险的医疗诊断系统,以提高患者管理效率并支持临床决策。

解法涉及整合多模态数据以提高慢性病预测的准确性。

子解法1:多模态数据集成

特征:慢性病的预测需要综合多种数据源(如临床笔记、实验室测试结果)来增强预测模型的信息丰度。

  • 原因:之所以采用多模态数据集成,是因为慢性病的表现和影响因素多样,需要多维度的数据支持以提高预测的全面性和准确性。
  • 例子:通过结合EHR中的文本数据(如医生的临床笔记)和量化数据(如血液检测结果),LLMMs能够更全面地分析患者的健康状态,预测疾病发展。

对于血液测试数据,构建了一个深度神经网络(DNN)来获取血液表示。

为了更好地整合这两种模态,我们使用了多头注意力层来计算来自两个领域的嵌入的注意力得分和矩阵。

最后,采用全连接层来预测多种疾病。

子解法2:实时数据处理与更新

特征:慢性病管理需求对数据的时效性极高,需要系统能够实时处理和更新数据。

  • 原因:之所以需要实时数据处理与更新,是因为慢性病状的快速变化需要及时调整治疗方案,以防病情恶化。
  • 例子:系统通过实时同步最新的健康检查结果和临床记录到数据库,并即时进行数据分析,以便快速反馈给医生和患者潜在的健康风险。
子解法3:采用大型语言多模态模型(LLMMs)进行深度学习分析

特征:LLMMs能够处理和理解大规模和复杂的数据集,适用于提取临床文本和实验室数据中的关键特征。

  • 原因:之所以使用LLMMs,是因为它们在处理复杂和大量的医疗数据方面具有优越性,可以捕捉深层次的模式和关联,提供精确的病症风险预测。
  • 例子:LLMMs分析患者的历史数据和最新测试结果,使用深度学习技术识别出可能导致疾病恶化的关键指标,从而提前警告医生和患者采取预防措施。

在阅读和理解了文章内容之后,可以看到背后的模式是通过技术集成和数据智能处理来增强医疗预测系统的效能。

体现了医疗信息技术领域中对实时、精确医疗决策支持系统的需求增长。

例如,将实时数据处理与多模态数据分析相结合,可以实现更为动态和精准的疾病管理,这在处理慢性病如糖尿病或心血管疾病时尤为重要。

慢病预测更多模态

在慢性病预测中,考虑多模态数据是非常有益的,因为这可以显著增加预测的精确度和全面性。

以下是一些重要的数据模态,它们在慢性病预测中可以提供关键信息:

  1. 临床笔记和医疗记录:这些文本数据提供了患者的详细病史,包括症状描述、治疗反应、以及医生的观察和推论。

  2. 实验室测试结果:血液、尿液等生化检测结果提供了关于患者生理状况的具体量化数据,如血糖、胆固醇、肝功能指标等。

  3. 影像医学数据:包括X光、MRI、CT扫描等影像资料,这些图像数据能帮助评估器官的结构和功能状况,对于诊断如癌症、心脏病等疾病尤为重要。

  4. 生理监测数据:如心电图、血压监测、血糖监测等连续的生理参数监测,可以提供关于患者状况的实时数据。

  5. 可穿戴设备数据:随着技术的发展,越来越多的健康相关数据可以通过可穿戴设备收集,如活动量、心率、睡眠质量等,这些数据有助于理解患者的生活习惯和日常健康状况。

  6. 遗传信息:基因数据可以揭示个体对特定疾病的易感性,对于预测遗传性疾病或评估疾病风险具有重要价值。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/766341.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Python中爬虫编程的常见问题及解决方案

Python中爬虫编程的常见问题及解决方案 引言: 随着互联网的发展,网络数据的重要性日益突出。爬虫编程成为大数据分析、网络安全等领域中必备的技能。然而,爬虫编程不仅需要良好的编程基础,还需要面对着各种常见的问题。本文将介绍…

【js + ckeditor】插入base64格式的图片

一、需求说明 直接把图片转成base64插入到富文本 二、需求分析 1、富文本图片格式处理位置 在ckeidtor的目录下有个plugins文件夹,在plugins下新建一个文件夹(自己命名,如simpleupload),进入simpleupload文件夹&…

用MySQL+node+vue做一个学生信息管理系统(四):制作增加、删除、修改的组件和对应的路由

1.下载依赖: npm install vue-router 在src目录下新建一个文件夹router,在router文件夹下新建一个文件router.js文件,在component目录下新建增加删除和修改的组件,引入router.js当中 此时的init组件为主页面((二、三&…

ROS2仿真工具-gazebo

gazebo独立于ROS2,就像插件一样,需要安装。 1.安装 sudo apt install gazebo sudo apt install ros-humble-gazebo-* 2.运行测试demo gazebo /opt/ros/humble/share/gazebo_plugins/worlds/gazebo_ros_diff_drive_demo.world 查看所有话题 ros2 top…

6月份上海二手房卖疯了,暴涨四成,反价房东被抛弃

6月份刚刚结束,北京、上海两大城市的房市成交情况纷纷出炉,从成交量来看上海房市明显比北京火热许多,同时与其他城市类似,消费者偏向于二手房。 6月份上海二手房往前高达2.6万套,环比增加超四成,创下2021年…

Windows下Visual Studio 中配置第一个CUDA工程

今天整NVIDIA 的CUDA 安装和第一个CUDA 代码,顺便添加一个有CUDA工程的空框架。 (1)首先确认自己的CUDA 已经安装成功 >>cmd 进入命令窗,在窗口输入查看cuda 是否安装成功,能查到CUDA的版本号,表示安…

在CenteOs7上安装mysql8.0(Super详细版)

在CenteOs7上安装mysql8.0 为什么用Mysql8.0?如何下载下载地址需要提前准备下载步骤 服务器上安装如何上传到服务器?通过wget下载到服务器并解压 开始安装非必须安装如果全部安装执行顺序 安装完后,启动mysql使用“systemctl”检测mysqld服务…

基于YOLOv10深度学习的CT扫描图像肾结石智能检测系统【python源码+Pyqt5界面+数据集+训练代码】深度学习实战、目标检测

《博主简介》 小伙伴们好,我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源,可关注公-仲-hao:【阿旭算法与机器学习】,共同学习交流~ 👍感谢小伙伴们点赞、关注! 《------往期经典推…

《企业实战分享 · 常用运维中间件》

📢 大家好,我是 【战神刘玉栋】,有10多年的研发经验,致力于前后端技术栈的知识沉淀和传播。 💗 🌻 近期刚转战 CSDN,会严格把控文章质量,绝不滥竽充数,如需交流&#xff…

《昇思25天学习打卡营第6天|网络构建》

文章目录 前言:今日所学:1. 定义模型类2. 模型层3. 模型参数 前言: 在第六节中我们学习了网络构建,了解了神经网络模型是由神经网络层和Tensor操作构成,我们使用的mindspore.nn中提供了常见的升级网络层的实现&#x…

Spark on k8s 源码解析执行流程

Spark on k8s 源码解析执行流程 1.通过spark-submit脚本提交spark程序 在spark-submit脚本里面执行了SparkSubmit类的main方法 2.运行SparkSubmit类的main方法,解析spark参数,调用submit方法 3.在submit方法里调用doRunMain方法,最终调用r…

Python学习速成必备知识,(20道练习题)!

基础题练习 1、打印出1-100之间的所有偶数: for num in range(1, 101):if num % 2 0:print(num) 2、打印出用户输入的字符串的长度: string input("请输入一个字符串:")print("字符串的长度为:", len(str…

PHP验证日本手机电话号码

首先,您需要了解手机号码的规格。 根据 ,手机和PHS(个人手持电话系统)可以理解为以“070”、“080”和“090”开头的11位数字。 此外,以“050”开头的11位特定IP电话号码也将包含在该目标中。 关于以“060”开头的F…

Git 基础-创建版本库 git init、添加到暂存区git add、查看状态git status、查看改动git diff

1.创建版本库 git init 在目录中创建新的 Git 仓库。 你可以在任何时候、任何目录中这么做,完全是本地化的。 在目录中执行 git init,就可以创建一个 Git 仓库了。 注意: 没事不要手动修改 .git 目录里面的文件,不然改乱了,可能就…

初识Java(复习版)

一. 什么是Java Java是一种面向对象的编程语言,和C语言有所不同,C语言是一门面向过程的语言。偏底层实现,比较注重底层的逻辑实现。不能一味的说某一种语言特别好,每一种语言都是在特定的情况下有自己的优势。 二.Java语言发展史…

Redis哨兵和集群模式

特性哨兵模式集群模式高可用性是是数据分片否是水平扩展否是配置复杂度低高管理复杂度低高多键操作支持是否(有限制) 哨兵模式 原理: Redis 哨兵模式是一种高可用性解决方案,它通过监控 Redis 主从架构,自动执行故障…

JavaSEJava8 时间日期API + 使用心得

文章目录 1. LocalDate2. LocalTime3. LocalDateTime3.1创建 LocalDateTime3.2 LocalDateTime获取方法 4. LocalDateTime转换方法4.1 LocalDateTime增加或者减少时间的方法4.2 LocalDateTime修改方法 5. Period6. Duration7. 格式转换7.1 时间日期转换为字符串7.2 字符串转换为…

怎么导出等长,差分对的走线长度?

简介 今天需要导出等长组,差分对的走线长度?这个需要怎么做呢? 差分对和等长组 先来熟悉一下等长组和差分对的概念(表现在软件上) 差分对,是一对两个网等长组,多个网络 导出各自的数据 打开…

马斯克宣布xAI将在8月份推出Grok-2大模型 预计年底推出Grok-3

在今年内,由特斯拉创始人马斯克创立的人工智能初创公司xAI将推出两款重要产品Grok-2和Grok-3。马斯克在社交平台上透露了这一消息,其中Grok-2预计在今年8月份面世,而Grok-3则计划于年底前亮相。 除此之外,马斯克还表示&#xff0c…

LLM指令微调Prompt的最佳实践(二):Prompt迭代优化

文章目录 1. 前言2. Prompt定义3. 迭代优化——以产品说明书举例3.1 产品说明书3.2 初始Prompt3.3 优化1: 添加长度限制3.4 优化2: 细节纠错3.5 优化3: 添加表格 4. 总结5. 参考 1. 前言 前情提要: 《LLM指令微调Prompt的最佳实践(一)&#…