深度学习数据集大合集—疾病、植物、汽车等

最近又收集了一大批深度学习数据集,今天分享给大家!废话不多说,直接上数据!

1、招聘欺诈数据集

招聘欺诈数据集:共收集了 200,000 条数据,来自三个网站。 该数据集共收集了 200.000 条数据,分别来自前程无忧、智联招聘和猎聘三家中国互联网招 聘网站。该数据集使用一套简单的统计规则为每个数据块分配一个欺诈概率,共有 9 个类别, 范围从 0%到 80%。请注意,数据集严重不平衡,因为它是真实的数据。

数据地址:https://www.dilitanxianjia.com/13415/

2、植物叶、花、果的语义分割数据集

一个全面收集图像精心标记的语义分割任务相关的植物分析。该数据集是计算机视觉、 农业和植物生物学领域的研究人员、开发人员和爱好者的宝贵资源。 数据集概述:总图像数:144 类别:叶,花,水果 Dataset Split: 训练组:85%(123 张) 验证组数:13%(18 张) 测试集:2% (3 张)

数据地址:https://www.dilitanxianjia.com/13412/

3、用于分类的大脑阿尔茨海默氏症数据集

关于数据集,使用此数据集分类是否有痴呆症形成在大脑中或没有。MC指轻度认知障碍(阿尔茨海默病早期),CN指认知障碍非疯呆症。共657张图片。

数据地址:https://www.dilitanxianjia.com/13410/

4、英国常见花卉图像分类数据集

关于数据集是一个包含102个花卉类别的图像分类数据集。这些花是在英国常见的花。每个类别由40至258幅图像组成。这些图像有很大的比例,姿势和光线的变化。此外,还有类别内变化很大的类别,以及几个非常相似的类别。

数据地址:https://www.dilitanxianjia.com/13408/

5、叶片表面缺陷检测图像数据集

关于数据集,检测刀片间良好的缺陷、刻痕和划痕。叶片表面缺陷检测数据集是一个多类图像分类数据集,可用于检测所生产的叶片中的缺陷。共400张图片。

数据地址:https://www.dilitanxianjia.com/13406/

6、眼部弓形虫病眼底图像数据集,视网膜眼底图像

己形虫病性脉络膜视网膜炎通常是由眼科医生通过对患者眼底图像的评估来诊断的。早期发现这些病变可能有助预防失明。数据集的眼底图像标记为三类,健康的眼睛,不活跃的和活动性的绒毛膜视网膜炎。该数据集是由三名眼科专家开发的,他们擅长利用眼底图像检测弓形虫病。该数据集将对致力于利用人工智能技术进行眼科图像分析以自动检测弓形虫病、脉络膜视网膜炎的研究人员有很大的帮助。

一、数据说明

名为“Data_Raw_6class_All”的文件夹中包含了在两个医院中心拍摄的原始眼底图像:

1.Hospital de Clinicas MedicalCenter:采集眼底图像所花费的时间为2018年至2020年。数据集由291张眼底图像组成JPG格式,大小为2124×2056像素。

2.Nios deA cos ta nu总儿科医院:18岁以下儿童获得图像。照片拍摄于2021年。该数据集包含121幅眼底图像,尺寸为1536×1152像素,采用JPG格式。

这些图像与疑似先天性弓形虫感染的患者相对应。眼底图像按健康和疾病分类。依次患病,可分为:i)仅不活动,ij)仅活动和iii)活动/非活动。每个类的数据数如下表所示。

数据地址:https://www.dilitanxianjia.com/13403/

7、新的面部情绪识别图像数据集

关于数据集 该数据集包含 47,000 张人脸灰度图像,每张图像的大小都调整为 48×48 像素。这些图像描 绘了各种面部表情,包括快乐中性、悲伤、愤怒、惊讶、厌恶和恐惧。为了增强平衡,采用 了数据增强技术。该数据集以 CSV 格式提供,可作为情感分类任务的宝贵资源。它包括训 练集中的 37,548 个样本,公共测试集中的 4,732 个样本,私人测试集中的 4.720 个样本。

数据地址:https://www.dilitanxianjia.com/13401/

8、吸烟与饮酒对身体的的影像,以及身体反应的数据集

本数据集收集自韩国国民健康保险局。所有个人信息和敏感数据均被排除在外。

数据地址:https://www.dilitanxianjia.com/13398/

9、甜椒、马铃薯、西红柿植物病害分类数据集

甜椒、马铃薯、西红柿植物病害分类数据集,共61900张图片;

数据地址:https://www.dilitanxianjia.com/13396/

10、特斯拉汽车类型分类检测数据集

包含:特斯拉_ModeL_S,特斯拉-Model_E,Tesla_Model-X,Tesla_Model_Y。

特斯拉模型S:电动豪华重新定义,特斯拉ModelS是电动豪华和高性能创新的象征。一个优质的全电动轿车,模型S拥有令人印象深刻的加速,远程能力.和时尚的设计。它的双电机全轮驱动变种提供了令人难以置信的速度,而宽敞的内部集成了先进的功能和简约的设计美

特斯拉Model3:电动无障碍特斯拉Model3旨在让更广泛的受众能够使用可持续交通工具。这款紧凑型电动轿车结合了经济性、效率和安全性,而不影响特斯拉的标志性性能。凭借其令人印象深刻的续航里程和先进的驾驶员辅助功能,Model3将电动交通工具推向了更广泛的人群。

特斯拉ModelX:未来的电动SUV,特斯拉ModelX以其独特的鹰翼式车门打破了这一模式,将SUV的实用性与电力推进的高效性结合在一起。这款电动SUV提供了宽敞的内部,令人印象深刻的性能,并注重安全,使它成为一个家庭友好的选择,有一点未来主义的天分。

特斯拉Y型:桥接多功能性和效率,特斯拉ModelY是一款紧凑型电动跨界车,在效率和多功能性之间架起了一座桥梁。与Model3共享其平台,ModelY提供了更宽敞的内部空间和更大的货物空间,同时保持了特斯拉车辆的效率和性能预期。它迎合了那些在城市友好的可操作性和冒险能力之间寻求平衡。

数据集共1321张图片。

数据地址:https://www.dilitanxianjia.com/13394/

11、苹果高光谱图像数据集,用于苹果施肥情况的自动检测

苹果高光谱图像数据集用于纯苹果和施肥苹果的高光谱数据集

用于测量所用化学物质水平的纯苹果和施肥苹果的高光谱数据集。数据集由各种苹果的高光谱图像组成。分为三大类:

1.“新鲜”–从市场直接购买的苹果图像,

2.”低浓度”–苹果浸入低浓度杀真菌剂/杀虫剂溶液即1克或1毫升肥料兑1升水)的图像,以及

3.高浓度“_苹果浸入低浓度杀真菌剂/杀虫剂溶液(即3克或3毫升肥料兑1升水)的图

像,以及默认情况下,高光谱图像保存为.bil格式。此数据集以.tif格式给出。

整个数据集被分类为三个

folders.1Apple_Samples,2.Fungicide_Apple3.lnsecticide_AppleApple_Samples文件夹由两个文件夹组成:monostar和nativo。“Monostar”被进一步分为四个文件夹,总共有207张图片。“Nativo”由=个文件夹组成,总共73张图片。

杀菌剂苹果由162张图片组成,分为三类,即新鲜苹果、低浓度溶液浸泡的苹果和高浓度溶液浸泡的苹果。本试验所用的杀菌剂是NATIVO。同样,杀虫剂苹果由175张图片组成,也分为三类,即新鲜苹果,低浓度溶液浸泡的苹果和高浓度溶液浸泡的苹果。所用杀虫剂为MONOSTAR。

数据地址:https://www.dilitanxianjia.com/13392/

12、内镜下膀胱组织分类图像数据集

内镜下膀胱组织分类数据集—多域内窥镜图像的半监督膀胱组织分类 共 1755 张图片,分为 4 大类,并且做好了标注。

数据地址:https://www.dilitanxianjia.com/13390/

13、芒果果实病害检测图像数据集

MangoFruitDDS是一个芒果病害数据集,包含1700张224+224的JPG格式图像。该数据集

包含四种疾病的图像,即链格跑,炭病,黑毒腐病和茎腐病。数据集中的另一个类别是健康

水果。水果图像是在塞内加尔的一个果园里用手机摄像头拍摄的。

数据地址:https://www.dilitanxianjia.com/13388/

14、家禽鸟类便便图像健康状况图像数据集

家禽鸟类便便图像健康状况数据集,用于健康状态预测的禽类粪便图像数据集

关于数据集:从饲养两种鸡的家禽农场收集的健康和非健康的鸡粪的图像数据集,即:尼日利亚的肉鸡和蛋鸡。该数据集共有14.618个带标签的图像,其像素为100×100,ipeg格式,并有一个标签指示图像编号中的图像名称。存储库中,数据被上传到2个单独的文件夹中;健康或非健康的每个文件夹包含从不同时间拍摄的图像到一天,早上,下午,晚上和其他。

数据地址:https://www.dilitanxianjia.com/13386/

15、基于灰度归一化的脑肿瘤图像数据集

数据共3096张图片

数据分类:

1、神经胶质瘤肿瘤

2、脑膜瘤肿瘤

3、正常的

4、垂体瘤

特点:

1、图像标准化:使用灰度直方图对图像进行了归一化处理,提高了图像质量和可比性

2、保留宽高比调整大小所有图像都已调整为一致的256X256像素大小,同时保留原始宽高比,确保图像均匀和详细。

数据地址:https://www.dilitanxianjia.com/13380/

16、肺炎胸部X线数据集的医学图像数据集

数据集被精心组织成三个文件夹:训练,测试和验证。每个文件夹包含每个图像类别的子文件夹,即肺炎和正常。该数据集包括5.863张X射线图像JPEG格式),分为两类(肺炎/正常)。

胸部X线图像(前后位)选自广州市妇女儿童医疗中心1-5岁儿科患者的回顾性队列。所有胸部X线影像检查均作为患者常规临床护理的一部分进行。对于胸部X光检查图像的分析,所有的胸部X光检查最初的质量控制,删除所有低质量或不可读的扫描。然后由两名专家医生对图像的诊断进行分级,然后才批准对AL系统进行培训。为了说明任何评分错误,第三位专家也对评价集进行了检查。共5856张图片。

数据地址:https://www.dilitanxianjia.com/13378/

17、宠物分类图像数据集

动物分类如下:

狗:拉布拉多寻回犬,金毛寻回犬,德国牧羊犬,斗牛犬,小猎犬,贵宾犬约克夏梗,达克犬,石子犬,拳击手,法国斗牛犬,罗威纳犬,小型雪纳瑞犬,可卡犬,大丹犬。

猫:波斯人,暹罗人,缅因州人,拉格布娃娃,孟加拉人,苏格兰褶皱人,Sphynx人,英国海滨人,阿比西尼亚人,俄罗斯蓝人,缅甸人,喜马拉雅山人,德文雷克斯人,美国海滨人,埃及毛人。

鸟:鹦鹉,鹦鹉,非洲灰鹦鹉,金丝雀,芬奇,伯克鹦鹉,贵格鹦鹉、小鹦鹉,小鹦鹉。

哺乳动物:

仓鼠,豚鼠,沙鼠,兔子,大鼠,小鼠,龙猫,刺猬,糖滑翔机,Degus,土拨鼠。

爬行动物:

豹壁虎,须龙,冠壁虎,绿盈蜥,变色龙

两栖动物:

非洲矮蛙,美西鲸,红眼树蛙,白氏树蛙,美洲蟾蛛,带蟒蚪的青蛙。

外来宠物:

龙猫,巨蜥,风信子金刚鹦鹉,有角蟾馀,狐狸沙袋鼠、马、雪貂、蝶鲸

共2262张图片。

数据地址:https://www.dilitanxianjia.com/13376/

18、阿尔茨海默病MRI图像数据,用于老年性痴呆的诊断

关于数据集

该数据集是关于老年痴呆症(AD)的。它包含26例受试者的MRI图像,其中10例为AD患者,10例为轻度认知障碍(MCI)患者,4例为正常对照。这些图像是从伊朗德黑兰的菲鲁兹加医院收集的。共475张图片。

数据地址:https://www.dilitanxianjia.com/13374/

19、2022-2023赛季现役球员的数据和头像

关于数据集

2022-2023赛季所有现役NBA球员的数据包括:名字和姓氏、位置、身高和体重、出生日期、原产国、最后一次上学、草稿信息、头部图片、图像文件名是球员的ID。

数据地址:https://www.dilitanxianjia.com/13372/

20、2005年至2021年道路交通事故乘客、车辆、地点和事故特征数据

关于数据集:本数据集是2005年至2021年法国道路交通事故的完整记录。“它包含了乘客、车辆、事故、地点和特征等信息数据是从法国政府提供的官方数据中抓取、清理和加入的。数据已经为建模进行了预处理,应该可以利用,而不必经过许多额外的清理步骤。非分类数据(例如年龄和nbv列)已经标准化,并且从原始数据中提取了月份、星期和一天的时间的正弦和余弦,以便进行周期性分析和检测周期性模式(即晚上、周末等)。

数据地址:https://www.dilitanxianjia.com/13370/

21、1131个高分辨率脑部MRI(磁共振成像)扫描图像,专门用于脑肿瘤检测和分类

该数据集包含1311个高分辨率脑部MRI(磁共振成像)扫描,专门用于脑肿瘤检测和分类。每张磁共振成像都有四类标记:“脑体”“脑瘤”“胶质瘤”或“无肿瘤”。“该数据集是开发和评估机器学习模型的宝贵资源,特别是卷积神经网络(CNN),用于脑肿瘤的自动检测和分类。

数据集详细信息:图片总数:1311

类别:

1.脑垂体(300张图片)

2脑膜瘤(306张)

3.神经胶质瘤(300张图片)

4.没有肿瘤(405张图片)

主要特点:

1、多种肿瘤类型的高质量MRI图像。

2、均衡的班级分布。

3、预处理可能包括去头盖骨、调整大小和标准化以保证一致性。

4、为每幅图像贴上地面真相标签,以便于有监督的学习。

数据地址:https://www.dilitanxianjia.com/13368/

添加图片注释,不超过 140 字(可选)

22、4类脑肿瘤分类图像数据集

共3264张图片:胶质瘤100张图片、脑膜瘤115张图片、无肿瘤105张图片、垂体瘤74张图片。

数据地址:https://www.dilitanxianjia.com/13366/

添加图片注释,不超过 140 字(可选)

23、3款车型采用不同颜色进行多标签分类图像数据集

数据集包含3种不同颜色的3辆不同的汽车。多标签分类的主要目的是能够根据这些类别来标记照片中的项目。

该数据集包括从Yandex采集的2735幅图像,包括以下类别:

里约红:431

河蓝:262

里约黑:306

瑞虎红:262

瑞虎蓝:273

瑞虎黑:286

浏览次数:346

马蒂兹蓝:334

马蒂兹布莱克:235

数据地址:https://www.dilitanxianjia.com/13364/

后面会不定期再给大家更新最新的各类深度学习数据集。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/111968.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

HackTheBox-Starting Point--Tier 1---Tactics

文章目录 一 题目二 实验过程三 Psexec工具使用 一 题目 Tags Network、Protocols、SMB、Reconnaissance、Misconfiguration译文:网络、协议、中小企业、侦察、配置错误Connect To attack the target machine, you must be on the same network.Connect to the S…

自动化测试实战篇:UI自动化测试用例管理平台搭建

用到的工具:python3 django2 mysql RabbitMQ celery selenium python3和selenium这个网上很多教程,我不在这一一说明; 平台功能介绍: 项目管理:用于管理项目。每个项目可以设置多个环境,例如开发环境…

怎样才知道一个单片机的性能到极限了?

怎样才知道一个单片机的性能到极限了? 就题主的问题,应该是想问CPU利用率的问题。可以看看Rt-thread中关于统计CPU利用率函数,其主要实现方式是在idle线程先关闭中断计数后,正常计数(可被其他线程打断),最近很多小伙伴…

竞赛知识点11【线段树】

文章目录 一、概念二、基本操作2.1、建树2.2、区间询问操作2.3、单点修改2.4、区间修改一、概念 线段树是用一种树状结构来存储一个连续区间的信息的数据结构。 它主要用于处理一段连续区间的插入,查找,统计,查询等操作。 复杂度: 设区间长度是 n n n,所有操作的复杂度是 l…

java修仙基石篇->instanceof子父类检查

instanceof检查子父类(或者是否能被强转) 作用1:检查某对象是否是某类的子类 如:儿子类继承了父亲类。 检查儿子类对象是否属于父亲类 作用2:检查两个对象是否可以强转 语法: 子类对象 instanceof 父…

蚂蚁蚁盾发布实体产业「知识交互建模引擎」,最快10分钟定制AI风控模型

数字化起步晚、数据分散稀疏、专业壁垒高、行业知识依赖「老师傅」,是很多传统产业智能化发展面临的难题。2023年云栖大会上,蚂蚁集团安全科技品牌蚁盾发布“知识交互建模引擎”,将实体产业知识与AI模型有机结合,助力企业最快10分…

【23真题】Top3简单专业课似双非!

今天分享的是23年复旦大学957的信号与系统试题及解析。 本套试卷难度分析:这套卷子平均分为120左右,最高分145分。22年复旦大学957信号与系统,我也发布过,若有需要戳这里自取!本套试题内容难度中等偏下,说…

主播直播美颜SDK:性能优化策略

当下,主播直播美颜SDK成为了越来越多主播的利器。这些SDK可以实时美化主播的外貌,提高视觉吸引力,但同时也需要处理大量的图像数据。因此,性能优化成为了不可或缺的一环。本文将探讨主播直播美颜SDK的性能优化策略,以确…

【详细教程】关于如何使用GitGitHub的基本操作汇总GitHub的密钥配置 ->(个人学习记录笔记)

文章目录 1. Git使用篇1.1 下载安装Git1.2 使用Git 2. GitHub使用篇2.1 如何git与GitHub建立联系呢?2.2 配置公钥 1. Git使用篇 1.1 下载安装Git 点击 官网链接 后,进入Git官网,下载安装包 然后根据系统类型进行下载,一般为wind…

如何修改MinIO Share时的URL

使用Helm方式在Kubernetes中部署MinIO后。选择分享文件,获得的分享连接域名为K8S内部Service连接地址,这样的地址不可以在集群外部使用。 修改MINIO_SERVER_URL 前置条件 (Helm部署方式)域名需要访问到Name为minio的K8S Service…

ReuseAndDiffuse笔记

https://arxiv.org/pdf/2309.03549.pdf https://mp.weixin.qq.com/s/pbSK4KOO2hqQU1-uwQzjBA 数据集: BLIP-2、MiniGPT4 等多模态大语言模型,对Moments-In-Time、Kinetics-700 和 VideoLT等数据集进行自动标注; Image-text datasets:平移缩…

《低代码指南》——维格云机器人常见报错怎么解决?

在使用维格机器人调用维格表的API过程中,可能会出现机器人执行结果未达到预期的情况,此时可能是机器人运行出现了问题;通过点击这个机器人右上角的“运行历史”可以查看运行记录,通过对运行记录的分析,可以推断出问题所在,然后进行修改。 而对于运行历史的分析,主要是针…

C语言——判断 101-200 之间有多少个素数,并输出所有素数

完整代码&#xff1a; // 判断 101-200 之间有多少个素数&#xff0c;并输出所有素数 #include<stdio.h>//判断一个数n是否为素数 int isPrimeNumber(int n){//1不是素数if (n1){return 0;}for (int i 2; i <(n/2); i){//当有n能被整除时&#xff0c;不是素数if ((n…

【ES专题】ElasticSearch 高级查询语法Query DSL实战

目录 前言阅读对象阅读导航前置知识数据准备笔记正文一、ES高级查询Query DSL1.1 基本介绍1.2 简单查询之——match-all&#xff08;匹配所有&#xff09;1.2.1 返回源数据_source1.2.2 返回指定条数size1.2.3 分页查询from&size1.2.4 指定字段排序sort 1.3 简单查询之——…

LTD249次升级 | 官微名片可编辑微信二维码 • 商城可图标展示商品分类 • 应用引擎改进导入功能、可批量导入图片文件

1、 官微名片支持编辑微信二维码、传真号等&#xff1b; 2、 新增商城分类列表功能页&#xff1b; 3、 应用引擎支持图片字段批量导入&#xff1b; 4、 官微中心功能优化&#xff1b; 5、 已知问题修复与优化&#xff1b; 01 官微名片(平台版) 1) 首页布局与样式优化 在本次…

树结构及其算法-二叉树遍历

目录 树结构及其算法-二叉树遍历 一、中序遍历 二、后序遍历 三、前序遍历 C代码 树结构及其算法-二叉树遍历 我们知道线性数组或链表都只能单向从头至尾遍历或反向遍历。所谓二叉树的遍历&#xff08;Binary Tree Traversal&#xff09;&#xff0c;简单的说法就是访问树…

轧钢厂安全生产方案:AI视频识别安全风险智能监管平台的设计

一、背景与需求 轧钢厂一般都使用打包机对线材进行打包作业&#xff0c;由于生产需要&#xff0c;人员需频繁进入打包机内作业&#xff0c;如&#xff1a;加护垫、整包、打包机检修、调试等作业。在轧钢厂生产过程中&#xff0c;每个班次生产线材超过300件&#xff0c;人员在一…

看完这个,别说你还找不到免费好用的配音软件

有很多小伙伴还在找配音工具&#xff0c;今天就给大家一次性分享四款免费好用的配音工具&#xff0c;每一个都经过测试&#xff0c;并且是我们自己也在用的免费配音工具 第一款&#xff0c;悦音配音工具 拥有强悍的AI智能配音技术&#xff0c;更专业&#xff0c;完美贴近真人配…

soul协议算法

逆向工程技术是指对软件或应用程序进行逆向分析以了解其内部机制和功能的过程。虽然我无法详细介绍"Soul App"的逆向工程技术&#xff0c;但以下是一些常见的逆向工程技术&#xff0c;可能与你的研究相关&#xff1a; 1. 反汇编&#xff08;Disassembly&#xff09;…

获取Webshell方法

CMS系统指的是内容管理系统。已经有别人开发好了整个网站的前后端&#xff0c;使用者只需要部署cms&#xff0c;然后通过后台添加数据&#xff0c;修改图片等工作&#xff0c;就能搭建好一个的WEB系统。 CMS获取Webshell方法 WordPress后台拿Webshell phpcms拿Webshell 非CMS…