医学影像数据集汇总分享

医学影像数据集汇总分享

  • 一、前言
  • 二、分类数据集
    • 2.1NIH Chest X-ray胸部X射线图像数据集
    • 2.2CC-CCII肺部CT图像数据集
  • 三、定位数据集
    • 3.1NIH Chest X-ray胸部X射线图像数据集
  • 四、分割数据集
    • 4.1CAMUS心脏超声图像数据集
    • 4.2CC-CCII肺部CT图像数据集
    • 4.3Shenzhen Hospital胸部X射线图像数据集
    • 4.4Montgomery County胸部X射线图像数据集
    • 4.5NLM Open-i Indiana Dataset胸部X射线图像数据集
    • 4.6LOLA11肺部CT图像数据集
  • 参考文档

一、前言

在深度学习领域,数据集的重要性不言而喻,因此本文对医学影像检测领域中公开的数据集进行了一个简要汇总,主要记录数据集的类型、数量等信息,并给出相应的下载地址。

本文主要借鉴了一个GitHub上开源的项目:医学影像数据集集锦,在其基础上进行了补充和完善。

本文主要根据检测任务的不同分别进行汇总,将数据集分为分类、定位、分割三种,内部根据数据量的大小进行逆序排序

二、分类数据集

2.1NIH Chest X-ray胸部X射线图像数据集

数据集下载网页地址为:https://www.kaggle.com/datasets/nih-chest-xrays/data/data,界面如下:
在这里插入图片描述

参数参数值
来源National Institutes of Health
数量共约112,120
文件格式图片:png格式,标签:csv格式
像素大小1024×1024
类别共8类
下载地址https://www.kaggle.com/datasets/nih-chest-xrays/data/data
文件大小45G(分为多个文件夹)

2.2CC-CCII肺部CT图像数据集

数据集下载网页地址为:http://ncov-ai.big.ac.cn/download,界面如下:
在这里插入图片描述

参数参数值
来源中国胸部CT图像研究联盟(China Consortium of Chest CT Image Investigation)
数量共约58766
文件格式图片:jpg、png格式,标签:文件压缩包名即为标签
像素大小512×512
类别共三类:COVID-19 pneumonia、common pneumonia、normal
下载地址http://ncov-ai.big.ac.cn/download
文件大小53T(分为多个压缩包)

三、定位数据集

3.1NIH Chest X-ray胸部X射线图像数据集

数据集下载网页地址为:https://www.kaggle.com/datasets/nih-chest-xrays/data/data,界面如下:
在这里插入图片描述

参数参数值
来源National Institutes of Health
数量共约880
文件格式图片:png格式,标签:csv格式
像素大小1024×1024
类别共1类
下载地址https://www.kaggle.com/datasets/nih-chest-xrays/data/data
文件大小图片分散,无法估计总大小

四、分割数据集

4.1CAMUS心脏超声图像数据集

数据集下载网页地址为:https://www.creatis.insa-lyon.fr/Challenge/camus/databases.html,界面如下:
在这里插入图片描述

参数参数值
来源University Hospital of St Etienne (France)
数量500×40=20,000张,共有500名病人,每名病人的超声影像文件可提取出40张图片
文件格式图片:nii.gz格式,标签:nii.gz格式
像素大小549×389
类别背景,心脏区域
下载地址https://humanheart-project.creatis.insa-lyon.fr/database/#collection/6373703d73e9f0047faa1bc8
文件大小3.6G

4.2CC-CCII肺部CT图像数据集

数据集下载网页地址为:http://ncov-ai.big.ac.cn/download,界面如下:
在这里插入图片描述

参数参数值
来源中国胸部CT图像研究联盟(China Consortium of Chest CT Image Investigation)
数量带有mask标记的共750张,总数共有21470张
文件格式图片:jpg格式,标签:png格式
像素大小512×512
类别0: Background (BG)1: Lung field (LF)2: Ground-glass opacity (GGO)3: Consolidation (CO)
下载地址https://download.cncb.ac.cn/covid-ct/ct_lesion_seg.zip
文件大小844M

4.3Shenzhen Hospital胸部X射线图像数据集

数据集下载网页地址为:https://lhncbc.nlm.nih.gov/LHC-downloads/dataset.html,界面如下:
在这里插入图片描述

参数参数值
来源Shenzhen No.3 Hospital in Shenzhen, Guangdong providence, China
数量带有mask标记的共336张,总数共有662张
文件格式图片:png格式,标签:png格式
像素大小像素大小不一致,3000×2900、2500×2500
类别0: 背景,255: 病变区域,病变类型体现在文件名
下载地址https://data.lhncbc.nlm.nih.gov/public/Tuberculosis-Chest-X-ray-Datasets/Shenzhen-Hospital-CXR-Set/Annotations/index.html
文件大小约为3.5G

4.4Montgomery County胸部X射线图像数据集

数据集下载网页地址为:https://lhncbc.nlm.nih.gov/LHC-downloads/dataset.html,界面如下:
在这里插入图片描述

参数参数值
来源Department of Health and Human Services of Montgomery County, MD, USA
数量138张,每张有两个肺部区域分割标签
文件格式图片:png格式,标签:png格式
像素大小4000×4900
类别0: 背景,255: 肺部区域,是否异常体现在文件名
下载地址https://data.lhncbc.nlm.nih.gov/public/Tuberculosis-Chest-X-ray-Datasets/Montgomery-County-CXR-Set/MontgomerySet/index.html
文件大小约为500M

4.5NLM Open-i Indiana Dataset胸部X射线图像数据集

数据集下载网页地址为:https://openi.nlm.nih.gov/faq#collection,界面如下:

在这里插入图片描述

参数参数值
来源National Library of Medicine(NLM) Indiana University
数量带有mask标签的共55张,正向拍摄图片共3864张,正向拍摄图片共3689张
文件格式图片:png格式,标签:tif格式
像素大小2300×2800
类别0: 背景,255: 肺部区域
下载地址https://openi.nlm.nih.gov/imgs/collections/NLMCXR_png.tgz
文件大小233M+1.3G

4.6LOLA11肺部CT图像数据集

数据集下载网页地址为:https://lola11.grand-challenge.org/Details/](https://lola11.grand-challenge.org/Details/),界面如下:
在这里插入图片描述

参数参数值
来源LOLA11
数量约24,000张,但没有标签
文件格式图片:mha格式,标签:Nan
像素大小512×512
类别Nan
下载地址https://zenodo.org/records/4708800
文件大小7.7G

参考文档

医学影像数据集集锦
NLM Lister Hill National Center for Biomedical Communications
胸部\肺部ct数据集
百度灵医智惠医疗AI影像能力再上新台阶
COVID-19 image data collection
Human Heart Project
Contrastive Pretraining for Echocardiography Segmentation with Limited Data
Medical Segmentation Decathlon

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/938790.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

计算无人机俯拍图像的地面采样距离(GSD)矩阵

引言 在无人机遥感、测绘和精细农业等领域,地面采样距离(Ground Sampling Distance,简称 GSD)是一个非常重要的指标。GSD 是指图像中每个像素在地面上实际代表的物理距离,通常以米或厘米为单位。GSD 决定了图像的空间…

图变换器的再思考:谱注意力网络

人工智能咨询培训老师叶梓 转载标明出处 图神经网络(GNNs)的传统策略是通过稀疏的消息传递过程直接编码图结构。然而,这种方法存在固有的局限性,例如过度平滑和过度压缩问题,这些限制了模型的性能和表达能力。为了克服…

构建全面的生产监控体系:从基础设施到业务服务

在现代 IT 系统中,监控体系是确保高可用性、高性能和稳定性的核心工具。一个完善的监控体系能够及时发现系统问题、分析问题根源并快速采取应对措施,避免故障进一步扩散。本文将从基础设施层、中间件层、容器与编排层、应用与服务层逐步展开,…

Rk3588 FFmpeg 拉流 RTSP, 硬解码转RGB

RK3588 ,基于FFmpeg, 拉取RTSP,使用 h264_rkmpp 实现硬解码. ⚡️ 传送 ➡️ RK3588, FFmpeg 拉流 RTSP, mpp 硬解码转RGBRk3588 FFmpeg 拉流 RTSP, 硬解码转RGBUbuntu x64 架构, 交叉编译aarch64 FFmpeg mppRK3588 , mpp硬编码rgb, 保存MP4视频文件.</

进程通信方式---共享映射区(无血缘关系用的)

5.共享映射区&#xff08;无血缘关系用的&#xff09; 文章目录 5.共享映射区&#xff08;无血缘关系用的&#xff09;1.概述2.mmap&&munmap函数3.mmap注意事项4.mmap实现进程通信父子进程练习 无血缘关系 5.mmap匿名映射区 1.概述 原理&#xff1a;共享映射区是将文件…

【Redis篇】Set和Zset 有序集合基本使用

目录 Set 基本命令 sadd SMEMBERS SISMEMBER SCARD 返回值&#xff1a; SPOP SMOVE SREM 集合间操作 交集&#xff1a; 并集&#xff1a; 差集&#xff1a; ​编辑 内部编码 使用场景&#xff1a; Zset 有序集合 Zset基本命令 ZADD ZCARD ZCOUNT ZRANGE …

SAP自定义权限对象

一、创建域和数据元素 SE11 二、创建权限字段 SU20 关联数据元素ZAPP 三、创建权限对象 SU21 关联权限字段ZAPP 四、新建程序&#xff0c;加入权限对象 SE38 在程序中增加以下块 AUTHORITY-CHECK OBJECT Z_BC_APP ID ZAPP FIELD 01. IF sy-subrc EQ 0. ENDIF. 五、…

linux0.11源码分析第二弹——setup.s内容

&#x1f680; 前言 继上篇博客分享了boot文件的内容后&#xff0c;本篇博客进而来到第二个文件&#xff1a; setup.s &#xff0c;对应了《linux源码趣读》的第5~8回。这部分的功能主要就是做了 三件事 &#xff0c;第一件事是做代码搬运和临时变量存放&#xff0c;第二件事是…

Halcon中histo_2dim(Operator)算子原理及应用详解

在Halcon中&#xff0c;histo_2dim算子是一个用于计算双通道灰度值图像的直方图的工具。以下是对该算子的原理及应用的详细解释&#xff1a; 一、原理 histo_2dim算子的函数原型为&#xff1a;histo_2dim(Regions, ImageCol, ImageRow : Histo2Dim : : )。 输入参数&#xff…

(vue)el-table在表头添加筛选功能

(vue)el-table在表头添加筛选功能 筛选前&#xff1a; 选择条件&#xff1a; 筛选后&#xff1a; 返回数据格式: 代码: <el-tableref"filterTable":data"projectData.list"height"540":header-cell-style"{border-bottom: 1px soli…

使用 Marp 将 Markdown 导出为 PPT 后不可编辑的原因说明及解决方案

Marp 是一个流行的 Markdown 演示文稿工具&#xff0c;能够将 Markdown 文件转换为 PPTX 格式。然而&#xff0c;用户在使用 Marp 导出 PPT 时&#xff0c;可能会遇到以下问题&#xff1a; 导出 PPT 不可直接编辑的原因 根据 Marp GitHub 讨论&#xff0c;Marp 导出的 PPTX 文…

UE5安装Fab插件

今天才知道原来Fab也有类似Quixel Bridge的插件&#xff0c;于是立马就安装上了&#xff0c;这里分享一下安装方法 在Epic客户端 - 库 - Fab Library 搜索 Fab 即可安装Fab插件 然后重启引擎&#xff0c;在插件面板勾选即可 然后在窗口这就有了 引擎左下角也会多出一个Fab图标…

Gin- Cookie\Session相关

Cookie&#xff0c;Session是什么&#xff1f; Cookie直译小饼干&#xff0c;是一些数据信息&#xff0c;类似于小型文本文件&#xff0c;存储在浏览器上。Cookie是进行第一次登录之后&#xff0c;由服务器创建后返回给浏览器的。之后&#xff0c;每当浏览器再次向同一服务器发…

使用Python打造高效的PDF文件管理应用(合并以及分割)

在日常工作和学习中&#xff0c;我们经常需要处理大量PDF文件。手动合并、分割PDF不仅耗时&#xff0c;还容易出错。今天&#xff0c;我们将使用Python的wxPython和PyMuPDF库&#xff0c;开发一个强大且易用的PDF文件管理工具。 C:\pythoncode\new\mergeAndsplitPdf.py 所有代…

深度学习中自适应学习率调度器

传统观点认为&#xff0c;太大的学习率不利于优化深度神经网络&#xff0c;而相比固定的学习率而言&#xff0c;变化的学习率更能提供快速的收敛。基于此&#xff0c;本文作者基于理论基础提出了一个计算深度神经网络学习率的新方法。实验结果证明了该方法的有效性。 训练神经…

文献研读|基于像素语义层面图像重建的AI生成图像检测

前言&#xff1a;本篇文章主要对基于重建的AI生成图像检测的四篇相关工作进行介绍&#xff0c;分别为基于像素层面重建的检测方法 DIRE 和 Aeroblade&#xff0c;以及基于语义层面重建的检测方法 SimGIR 和 Zerofake&#xff1b;并对相应方法进行比较。 相关文章&#xff1a;论…

ElasticSearch06-分片节点分配

零、文章目录 ElasticSearch06-分片节点分配 1、单节点多分片多副本 &#xff08;1&#xff09;启动一个空节点 节点的配置如下 cluster.name: mycluster node.name: node-01 node.master: true node.data: true network.host: 127.0.0.1 http.port: 9201 transport.tcp.p…

信息学奥赛一本通 1438:灯泡 | 洛谷 P5931 [清华集训2015] 灯泡

【题目链接】 ybt 1438&#xff1a;灯泡 洛谷 P5931 [清华集训2015] 灯泡 【题目考点】 1. 三分 求函数极值 2. 相似三角形 3. 对钩函数 【解题思路】 首先考虑影子还没有到达对面墙壁的情况 记BM长度为x&#xff0c;影子为AM&#xff0c;长度为L。三角形ABC相似于三角…

揭开 Choerodon UI 拖拽功能的神秘面纱

01 引言 系统的交互方式主要由点击、选择等组成。为了提升 HZERO 系统的用户体验、减少部分操作步骤&#xff0c;组件库集成了卓越的拖拽功能&#xff0c;让用户可以更高效流畅的操作系统。 例如&#xff1a;表格支持多行拖拽排序、跨表数据调整、个性化调整列顺序&#xff1…

【物联网技术与应用】实验4:继电器实验

实验4 继电器实验 【实验介绍】 继电器是一种用于响应施加的输入信号而在两个或多个点或设备之间提供连接的设备。换句话说&#xff0c;继电器提供了控制器和设备之间的隔离&#xff0c;因为设备可以在AC和DC上工作。但是&#xff0c;他们从微控制器接收信号&#xff0c;因此…