眼底照 + OCT图 + 精神状态 ,预测阿尔兹海默症

眼底照片和OCT图像,预测阿尔兹海默症

    • 数据
    • 多模态网络
    • 模型集成
    • 可视化分析

 


论文:https://www.ophthalmologyretina.org/action/showPdf?pii=S2468-6530%2824%2900045-9

目前,认知障碍的诊断依赖于血清和蛋白质生物标志物的检测、脑脊液检查和正电子发射断层扫描等成本高昂且有时具有侵入性的测试。

因此,这些测试并不适合在基层医疗环境或社区中进行认知障碍的检测。

这篇研究的目的是开发和验证一个能够快速、简便地准确识别认知障碍患者的人工智能系统。

过程:开发深度学习模型、模型验证和性能改进。

深度学习模型:

  • 使用多模态数据输入,结合眼底照片和OCT图像。
  • 应用卷积神经网络(CNN)技术,设计多模态网络架构。

之所以使用此子解法:因为多模态视网膜图像可以提供关于视网膜和脉络膜的综合信息,这对于识别认知障碍具有潜在价值。

例如,使用眼底图像可以观察视网膜血管的变化(视网膜发病中后期变化),而OCT图像可以提供视网膜层次结构的详细视图(视网膜发病前期变化)。

性能改进:

  • 通过增加数据样本的多样性和数量来优化和改进模型。
  • 应用模型集成技术,结合多种网络架构的优势。

之所以使用此子解法:增加样本多样性可以帮助模型更好地泛化到不同的人群,而模型集成可以提高预测性能,减少过拟合的风险。

例如,集成多个不同架构的网络(如ResNet-50, InceptionV3, DenseNet-121和VGG),可以利用它们各自的优势,提高整体模型的鲁棒性和准确性。

数据

入选标准是年龄≥50岁。共有4403名符合条件的个体,其中3468人(78.8%,包括1963名女性,占56.6%)参加了眼科检查。

需要每位参与者的眼底照片(双眼的视盘中心和黄斑中心)清晰可见,OCT图像(双眼的中心凹水平截面)层次分明且可以分析,以及迷你精神状态检查(MMSE)的数据。

  • 总共有3468名参与者提供了眼底图像,其中包括6014张视盘中心图像和6106张黄斑中心图像。
  • 2974名参与者提供了OCT图像,共计5948张。

在这里插入图片描述

开发数据集:

  • 训练集:包含8248张眼底照片,4124张OCT图像,共2062名参与者。
  • 内部验证集:包含1176张眼底照片,588张OCT图像,共294名参与者。

外部验证数据集:

  • 外部测试集1:包含1180张眼底照片,590张OCT图像,共295名参与者。
  • 外部测试集2:包含1180张眼底照片,590张OCT图像,同样是295名参与者。

主要统计数据和结果:

  • 性别:训练集中男性占42.6%,外部测试集中大约46%。
  • 年龄:训练集平均年龄约为63.84岁,外部测试集平均年龄约为63至64岁。
  • 教育水平:较多参与者接受过7-9年的教育。
  • 体力活动:训练集中有34.7%的参与者活跃,而外部测试集这一比例稍低。
  • 健康状况:包括体质指数、血压、总胆固醇、高血压、糖尿病和与年龄相关的眼病情况。
  • 迷你精神状态检查(MMSE):平均分数在训练集和验证集中约为26分,外部测试集约为26.5分。

为了提高模型的鲁棒性和适用性,训练集故意包括了患有眼病的患者的视网膜图像,因为AMD和青光眼等与年龄相关的眼病在50岁以上的个体中很常见。

对所有参与者使用4张眼底照片(双眼的视盘中心和黄斑中心图像)和2张OCT图像(双眼的中心凹水平截面)进行模型开发和验证。

同时收集了包括性别、年龄、教育水平、体力活动、收缩压、体质指数(BMI)、总胆固醇以及高血压、糖尿病和与年龄相关的眼病状况等风险因素数据。

在这里插入图片描述

多模态网络

训练用于分类眼底和OCT图像的CNN模型。采用3种独立的特征编码器(例如VGG-19)提取特征,并通过共享全连接层进行分类。

  • 使用来自不同视场的眼底图像和OCT图像的特征,通过编码器提取并合并特征。
  • 这些特征被输入到共享的分类器,并通过全连接层进行处理,以建立用于认知障碍筛查的模型。

模型集成

为了提高系统的整体性能和鲁棒性,训练了4个使用不同计算视觉学习主干网络的多模态网络,如VGG-19、ResNet-50、InceptionV3和DenseNet-121。

  • 模型集成技术,结合了四种不同的深度学习模型(ResNet-50, InceptionV3, DenseNet-121, 和 VGG),通过简单的平均方法融合,以增强模型的鲁棒性和准确性。
  • 通过集成多个模型,研究提高了算法对输入数据的综合理解能力,减少了过拟合的风险,使得模型在未见数据上的表现更加平滑和泛化。
  1. 独立训练多个模型
  • 选择模型架构:选择具有不同特点的多个模型架构。
  • ResNet-50 擅长处理层次较深的网络结构问题
  • InceptionV3 在处理图片的尺度上有优势,能够捕捉到不同尺度上的特征
  • DenseNet-121 则通过其密集连接的方式改进了信息和梯度的流动,使得网络更加高效
  • 而 VGG 模型结构简单,但在图像识别上表现良好
  • 训练过程:每个模型分别在相同的数据集上进行独立训练。
  • 这包括使用眼底照片和OCT图像作为输入,训练每个模型以识别认知障碍的迹象。
  1. 模型输出的融合
  • 输出平均:在模型训练完成后,将这些模型的输出(通常是分类的概率)进行平均处理。
  • 融合策略:简单平均是一种常见的融合策略,因为它不需要额外的权重调整,可以减少过拟合的风险,并且实现简单。
  • 每个模型被赋予相等的权重,其预测结果的平均值被用作最终预测。

模型集成能够综合不同模型的优势,降低因模型特定偏差带来的风险,从而在多样化的数据上获得更稳定和可靠的性能。

例如,在眼底图像分析中,不同模型可能对不同类型的图像特征(如血管结构、黄斑区的细节等)有不同的敏感性,通过模型集成,可以综合这些特征的识别能力,提高诊断的准确性和鲁棒性。

模型性能

  • 模型1(单独使用以黄斑为中心的眼底照片)
  • 模型2(单独使用以视盘为中心的眼底照片)在三个数据集(内部验证、外部验证1、外部验证2)中的AUC值分别为0.738/0.758/0.725 和 0.754/0.732/0.702。
  • 模型3(结合使用以黄斑和视盘为中心的眼底照片)在各数据集中的AUC值有轻微提高,分别为0.766、0.760、0.750。
  • 模型4(使用OCT图像中穿过中心凹的水平截面)的性能略有下降,AUC值为0.726、0.707、0.702。
  • 模型5(多模态模型,结合使用眼底照片和OCT图像达到了最高的性能,AUC值为0.820、0.786、0.784。
  • 模型6(使用CAIDE风险评分)的AUC值为0.836、0.795、0.749。

模型5的性能显著优于模型1至4。

  • 与CAIDE风险评分模型相比,模型5在AUC上没有显著差异,但表现更稳定,准确性更高。
  • 在不同性别和年龄组中,模型5的表现没有显著差异,展示了良好的稳定性。

可视化分析

热图分析显示:

  • 在认知功能正常的参与者中,CNN主要使用眼底照片中的视盘信号,而OCT图像的重要性较低
  • 对于认知障碍的参与者,CNN使用的信号包括眼底照片中视盘周围的信号,以及OCT图像中黄斑和视盘区域的视网膜和脉络膜

在这里插入图片描述
D、E和F图则对应地展示了认知功能正常的个体的相同图像。

A、B和C图分别展示了认知障碍患者的黄斑中心眼底照片、视盘中心眼底照片和OCT图像的热图。

看可视化的结果,阿尔兹海默症,OCT 图才是重点。

但如果只用 OCT 图,效果还不如 fundus图(眼底图)。

综合使用效果最好,现在医学算法,都是多模态、模型集成效果更 SOTA。

下一步:

  • 尽管研究证实了使用视网膜图像识别认知障碍的可行性,但样本量的限制可能影响了模型性能的最优化。
  • 未来研究需要在更大、多中心的人群中验证模型的普适性,使用不同的眼底相机和OCT设备,包括针对视盘中心的OCT图像和OCT血管造影的检查。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/681237.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

充电宝哪款质量好性价比高?精选四大宝藏款充电宝分享

在这个快节奏的数字时代,智能手机、平板电脑等电子设备已成为我们日常生活与工作中不可或缺的伙伴。然而,电量焦虑似乎也如影随形,时刻考验着我们的耐心与行程安排。于是,一款质量上乘、性价比高的充电宝便成了许多人的随身必备“…

超实用!新手必看的色彩设计指南

在UI设计中,色彩设计扮演着非常重要的角色,它不仅可以为用户带来视觉上的愉悦体验,还可以影响用户的情绪、行为和注意力。通过运用不同的色彩搭配和调性,设计师可以引导用户的注意力,突出重点内容或功能,提…

告别鼠标:蓝牙无线安卓模拟鼠标,绘图板,手写板操作电脑PC端,卡卡罗特也说好,儿童节快乐

家人们,上链接了:https://download.csdn.net/download/jasonhongcn/89387887 横屏模式: 竖屏模式: 操作说明: 1. 手势滑动模拟鼠标移动 2. 界面如果有滚动条,右手指按紧,通过左手指移动实现…

Spring Security 注册过滤器关键点与最佳实践

在 Spring Security 框架中,注册过滤器是实现身份验证和授权的关键组件。正确配置和使用注册过滤器对于确保应用程序的安全性至关重要。以下是一些关于 Spring Security 注册过滤器的注意事项和最佳实践。 过滤器链顺序: 注册过滤器通常位于过滤器链的末…

揭秘业务系统数据安全三大核心问题:“谁在用”、“用什么”和“怎么用”

数据库宛如一座坚固的宝库,守护着无尽的智慧与财富—数据,如同熠熠生辉的金币。当宝库的门紧闭时,金币得以安然无恙。 然而,在业务系统的广阔天地中,这些数据金币被精心挑选、流通使用,每一枚都承载着无尽…

eNSP学习——RIP路由协议基础配置

目录 主要命令 原理概述 实验内容 实验目的 实验拓扑 实验编址 实验步骤 1、基本配置 2、使用RIPv1搭建网络 开启 RIP调试功能 3、使用RIPv2搭建网络 RIPv1和RIPv2的不同 需要eNSP各种配置命令的点击链接自取:华为eNSP各种设备配置命令大全PD…

栈排序00

题目链接 栈排序 题目描述 注意点 对栈进行排序使最小元素位于栈顶最多只能使用一个其他的临时栈存放数据不得将元素复制到别的数据结构(如数组)中栈中的元素数目在[0, 5000]范围内 解答思路 本题是要实现一个小顶堆,可以直接使用Priori…

Linux C语言: 数据类型

一、 为什么要引入数据类型 • 计算机中每个字节都有一个地址(类似门牌号) • CPU通过 地址 来访问这个字节的空间 0x20001103 1 0 0 1 0 0 1 1 0x20001102 1 1 1 0 1 1 1 0 0x20001101 1 1 1 1 0 1 0 1 0x20001100 0 …

掌握ChatGPT的正确打开方式

引言 随着人工智能技术的飞速发展,自然语言处理(NLP)领域取得了显著的突破。其中,聊天生成预训练变换器(ChatGPT)作为一种新型的对话式AI模型,引起了广泛关注。本文将详细介绍ChatGPT的正确使用…

linux业务代码性能优化点

planning优化的一些改动----------> 减少值传递&#xff0c;多用引用来传递 <---------- // ----------> 减少值传递&#xff0c;多用引用来传递 <---------- // 例1&#xff1a; class A{}; std::vector<A> v; // for(auto elem : v) {} // 不建议&#xff…

视频监控汇聚平台LntonCVS国标GB28181协议实现语音对讲功能

在当今这个智能技术飞速发展的时代&#xff0c;人工智能已经成为了电子产品领域的一股不可忽视的热门趋势。随着科技的不断进步&#xff0c;越来越多的电子产品开始融入人工智能技术&#xff0c;从而为其开拓了全新的发展路径。在这个大背景下&#xff0c;安防摄像头无插件直播…

Mitmproxy作为瑞士军刀可拦截、检查、修改和重放网络流量可用于渗透测试。

Mitmproxy是一个开源的中间人代理工具&#xff0c;用于拦截、修改和查看HTTP和HTTPS流量。它可以用于调试、测试和分析网络应用程序和移动应用程序的通信。 Mitmproxy可以在本地计算机上作为一个代理服务器运行&#xff0c;将所有流量导向到它&#xff0c;然后可以查看和修改这…

CA到TA的调用流程是什么?如何实现的?

快速链接: . &#x1f449;&#x1f449;&#x1f449;Trustzone/TEE/安全 面试100问-目录 &#x1f448;&#x1f448;&#x1f448; 付费专栏-付费课程 【购买须知】:联系方式-加入交流群 ----联系方式-加入交流群 个人博客笔记导读目录(全部) 简单一点来说&#xff0c;CA…

电器公司2套PROE如何满足20人使用?

电器公司的日常运营高度依赖于各类软件工具&#xff0c;其中PROE作为广泛应用于产品设计领域的软件&#xff0c;在电器厂公司的生产流程中扮演着举足轻重的角色。如何合理配置和管理PROE软件资源&#xff0c;以满足20人同时使用的需求&#xff0c;是许多电器厂公司面临的实际问…

比瓴科技以何魅力吸引安全大牛?

今年4月&#xff0c;专注于软件供应链安全的行业领导厂商比瓴科技宣布&#xff0c;与元豚科技战略合并&#xff0c;元豚科技创始人唐誉聪加入比瓴&#xff0c;担任合伙人及研发副总裁一职。唐誉聪表示&#xff0c;将携手比瓴共同推动持续应用安全平台(ASPM)的发展&#xff0c;将…

深度学习论文: DINOv2: Learning Robust Visual Features without Supervision

深度学习论文: DINOv2: Learning Robust Visual Features without Supervision DINOv2: Learning Robust Visual Features without Supervision PDF: https://arxiv.org/abs/2304.07193 PyTorch代码: https://github.com/shanglianlm0525/CvPytorch PyTorch代码: https://githu…

【产品面对面】deepin 办公升级:打印管理器全功能解析及驱动资源汇总

内容来源&#xff1a;deepin&#xff08;深度&#xff09;社区 如果你想要或者正在使用 deepin 进行办公&#xff0c;那么一定会使用到 “打印管理器”。打印管理器作为一款管理打印机的工具&#xff0c;将成为你办公得力助手之一。近期&#xff0c;我们会在 deepin 应用商店发…

【学习心得】算法刷题心得分享

一、为什么要刷题&#xff1f; 提升编程能力&#xff0c;强化对数据结构的理解&#xff0c;熟练掌握常用的算法等为竞赛、考试做准备找实习、找工作需要&#xff08;上机考试面试手撕代码&#xff09;提升自信心&#xff0c;放松一下 二、刷题前应该有哪些知识储备&#xff1f;…

Web 网页性能优化

Web 网页性能及性能优化 一、Web 性能 Web 性能是 Web 开发的一个重要方面&#xff0c;侧重于网页加载速度以及对用户输入的响应速度 通过优化网站来改善性能&#xff0c;可以在为用户提供更好的体验 网页性能既广泛又非常深入 1. 为什么性能这么重要&#xff1f; 1. 性能…

Spring Boot前后端简单集成MinIo开发

Spring Boot前后端简单集成MinIo开发 源码地址重要配置和代码MinIO配置核心代码 最终效果 源码地址 minioStudy 重要配置和代码 MinIO配置 pom文件引入依赖 <!-- minio --> <dependency><groupId>io.minio</groupId><artifactId>minio</ar…