大模型-人类病理学的语言视觉AI助手

论文摘要翻译与评论

论文标题:

A Multimodal Generative AI Copilot for Human Pathology

摘要翻译:

计算病理学领域已经在任务特定的预测模型和任务无关的自监督视觉编码器的发展方面取得了显著进展。然而,尽管生成性人工智能快速增长,针对病理学定制的通用多模态AI助手和副驾驶的研究却很有限。在此,我们提出了PathChat,这是一个面向人类病理学的视觉-语言通用AI助手。我们通过将病理学基础视觉编码器与预训练的大型语言模型结合,并在超过45.6万个多样化的视觉语言指令上进行微调,构建了PathChat。我们将PathChat与几种多模态视觉语言AI助手和商用的GPT4V(支持ChatGPT-4的多模态通用AI助手)进行了比较。PathChat在来自不同组织起源和疾病模型的多项选择诊断问题中表现出最先进的性能。此外,使用开放式问题和人类专家评估,我们发现PathChat对与病理学相关的多样化查询产生了更准确和病理学家更喜欢的回答。作为一个可以灵活处理视觉和自然语言输入的交互式通用视觉-语言AI副驾驶,PathChat有望在病理学教育、研究和人机协作临床决策中找到有影响力的应用。

实验图

image.png
image.png

主要方法:
  1. 模型构建
  • 使用基于病理学的视觉编码器,并结合预训练的大型语言模型,形成完整的多模态大型语言模型(MLLM)。
  • 在超过45.6万个多样化的视觉语言指令上进行微调,包括99.9万个问答回合。
  1. 数据集
  • 微调数据集包含超过45.6万条指令和99.9万次问答回合。
  • 使用TCGA和内部病理学档案中的全片诊断图像(WSIs)进行模型评估。
  1. 模型评估
  • 对比了PathChat与几种多模态视觉语言AI助手和GPT4V在多项选择诊断问题和开放式问题回答中的性能。
  • 采用了包括图像和临床背景在内的多种评估策略。
主要贡献:
  1. PathChat的提出
  • PathChat作为一个通用的视觉-语言AI助手,展示了在多项病理学任务中的强大性能,特别是在诊断问题上的准确性。
  1. 高质量数据集的构建
  • 构建了一个包含45.6万条指令和99.9万次问答回合的高质量训练数据集,为模型提供了丰富的训练素材。
  1. 全面的模型评估
  • 通过对比多种先进模型,证明了PathChat在多项病理学任务中的优越性。
创新性:
  1. 多模态模型的集成
  • 将视觉编码器与预训练的大型语言模型结合,形成了一个强大的多模态模型。
  1. 广泛的训练和评估数据
  • 使用了大量的多样化数据进行微调和评估,确保了模型的广泛适用性和高性能。
方法的长强点和弱点:
  • 优势
    • 多模态结合:同时处理视觉和语言输入,提高了模型的灵活性和适用性。
    • 高性能:在多个病理学任务中表现出色,尤其是在诊断问题上。
    • 广泛应用:在病理学教育、研究和临床决策中有潜在的广泛应用。
  • 弱点
    • 数据依赖:模型的性能高度依赖于训练数据的质量和多样性。
    • 实时应用:虽然性能优越,但在实际临床应用中,实时处理和响应速度可能需要进一步优化。

通过以上分析,PathChat展示了在病理学领域中的巨大潜力,特别是在教育和临床决策支持方面。然而,未来的研究需要继续优化模型,特别是在实时应用和数据多样性方面,以确保其在更广泛的临床环境中能够有效应用。

论文下载链接

链接:https://pan.quark.cn/s/078e11dcaf9e

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/714653.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

史上最详细的轨迹优化教程-机器人避障及轨迹平滑实现(干货满满)

有一些朋友问我到底如何用优化方法实现轨迹优化(避障轨迹平滑等),今天就出一个干货满满的教程,绝对是面向很多工业化场景的讲解,为了便于理解,我选用二维平面并给出详细代码实现,三维空间原理相…

MySQL数据操作与查询- 聚合函数和分组查询

一、聚合函数 聚合函数主要用来进行数据 汇总 。 1、sum 返回选取的某列的总和。 语法: select sum(字段名) from 表名 where 条件表达式 2、max 返回选取的某列的最大值。 语法: select max(字段名) from 表名 where 条件表达式 3、min 返…

LoadBalance客户端负载均衡

1. 前言Ribbon Spring Cloud Ribbon是基于Netflix Ribbon实现的一套客户端 负载均衡的工具。简单的说,Ribbon是Netflix发布的开源项目,主要功能是提供客户端的软件负载均衡算法和服务调用。Ribbon客户端组件提供一系列完善的配置项如连接超时&#xff0…

VMware虚拟机linux无法使用ifconfig的解决方法

在有些linux系统中,输入ifconfig会报错,这是为什么呢? 如果出现 那是说明,你的linux内没有对应的命令。 具体可输入 ls /sbin 查看,发现其中确实没有ifconfig命令 这个解决很简单,在命令行输入 sudo apt-get inst…

DDPAI盯盯拍记录仪删除后的恢复方法(前后双路)

DDPAI盯盯拍行车记录仪的口碑相当不错,其产品一直以行车记录仪为主,曾经使用过比较早的产品,体验还不错。下面来看下这个DDPAI的视频恢复方法。 故障存储: 64G存储卡 /文件系统:FAT32 故障现象: 在发生事故后在记录仪上看到了…

OpenCV目标识别

一 图像轮廓 具有相同颜色或强度的连续点的曲线。 图像轮廓的作用 可以用于图像分析 物体的识别与检测 注意 为了检测的准确性,需要先对图像进行二值化或Canny操作。 画轮廓时会修改输入的图像。 轮廓查找的API findContours(img,mode,ApproximationMode,...)…

北航第六次数据结构与程序设计作业(查找与排序)选填题

一、 顺序查找的平均查找长度ASL(1 2 …… n)/ n (n 1)/ 2 二、 这半查找法的平均查找次数和判定树的深度有关系。若查找一个不存在的元素,说明进行了深度次比较。 注意,判定树不是满二叉树,因此深…

创新案例 | 3个关键策略:乳制品品牌认养一头牛如何通过私域流量运营获取1400万会员

探索认养一头牛如何运用创新的私域流量运营策略,在竞争激烈的乳制品市场中脱颖而出,实现会员数量的飞速增长至1400万。本文深入分析了其数据驱动的广告投放、高效的会员运营体系和创新的用户互动机制,为企业提供提升用户粘性和品牌忠诚度的宝…

Postgre 调优工具pgBadger部署

一,简介: pgBadger(日志分析器)类似于oracle的AWR报告(基于1小时,一天,一周,一月的报告),以图形化的方式帮助DBA更方便的找到隐含问题。 pgbadger是为了提高…

嵌入式数据库的一般架构

嵌入式数据库的架构与应用对象紧密相关,其架构是以内存、文件和网络等三种方式为主。 1.基于内存的数据库系统 基于内存的数据库系统中比较典型的产品是每个McObject公司的eXtremeDB嵌入式数据库,2013年3月推出5.0版,它采用内存数据结构&…

【Java】过滤器/拦截器

文章目录 两者区别request链路全过程 在实际开发中,过滤器和拦截器都是经常使用的技术,但一被提及到其区别时,整个人就愣住了,好像没有认真地对两者进行区别和总结,这两者之间也确实很容易混淆,因此结合了很…

python读取excel导入数据库

一、环境准备,安装包 pip install pandas openpyxl sqlalchemy二、数据准备 三、代码编写 from sqlalchemy import create_engine import pandas as pdclass GDPDataImporter:def __init__(self, db_type, dbapi, host, port, database, username, password):&quo…

【Git】基础操作

初识Git 版本控制的方式: 集中式版本控制工具:版本库是集中存放在中央服务器的,team里每个人work时从中央服务器下载代码,是必须联网才能工作,局域网或者互联网。个人修改之后要提交到中央版本库 例如:SVM和…

Python(二)---数据类型与变量、以及运算符

文章目录 前言1.Python程序的构成1.1.代码的组织和缩进1.2.使用\行连接符 2.对象和引用、标识符规则2.1.对象2.2.引用2.3.标识符规则 3.变量和简单赋值语句3.1.变量的声明和赋值3.2.删除变量和垃圾回收机制3.3.常量3.4.链式赋值3.5.系列解包赋值 4.最基本内置数据类型4.1.数字和…

rclone 上传资料到 onedrive 遇到限速问题解决

原因分析 可能和脚本参数设置有关系,我的参数是: rclone copy "F:\阿里云盘\6666\局域网" "od:影视" --ignore-existing -u -v -P --transfers20 --ignore-errors --buffer-size128M --check-first --checkers10 --drive-acknowledge-abuse差不多8G大小的…

C#——值类型和引用类型的区别详情

值类型和引用类型的区别 值类型 值类型: 常用的基本数据类型都是值类型:bool 、char、int、 double、 float、long 、 byte 、ulong、uint、枚举类型、 结构体类型等特点: 在赋值的过程当中,把值的本身赋值给另一个变量,再修改…

关于STM32上用HID HOST调鼠标数据的解析

一、前言 关于这章主要是基于我前面的那篇文章 链接: 关于怎么用Cubemx生成的USBHID设备实现读取一体的鼠标键盘设备(改进版) https://blog.csdn.net/qq_29187987/article/details/139535648?spm1001.2014.3001.5501 引用的文章的简介 引用的这篇文…

FFmpeg编解码的那些事(3)-视频硬解码的基础知识

目录 前言: 1.iso/os x平台 2.windows平台 3.linux平台 4.Tips: 5.结论: 前言: 视频硬解码的过程就是把视频提取成图片变显示出来,就是播放器播放视频的过程,就可以理解为解码的过程。 在不同的系统…

微信同声传译小程序插件使用教程

微信同声传译小程序插件 —— 机器翻译、智能语音 案例可搜索“一起学英语鸭”小程序查看, 实现效果如下图: 插件功能 语音转文字 语音合成 文本翻译 step 1:添加插件 在使用前,需要登录官网 设置 → 第三方服务 → 添加插件…

UniApp+Vue3使用Vant-微信小程序组件

第一步:打开创建好的UniappVue3的项目 第二步:下载Vant-Weapp npm i vant/weapp -S --production 第三步:修改目录名称 wxcomponents 必须是wxcomponents 第四步:将下载好的vant中的dist目录剪切到当前wxcomponents目录下 第五…