基于数据挖掘与机器学习揭秘脱发主因

🌟欢迎来到 我的博客 —— 探索技术的无限可能!


🌟博客的简介(文章目录)

基于数据挖掘与机器学习揭秘脱发主因

目录

  • 一、绪论
    • 背景描述
    • 数据说明
    • 内容大概
  • 二、导入包以及数据读取
  • 三、数据预览
  • 四、探究导致脱发的因素
    • 4.1可视化分析
    • 4.2统计检验
  • 五、逻辑回归模型
    • 5.1数据预处理
    • 5.2多重共线性检验
    • 5.3划分数据
    • 5.4建立模型
    • 5.5模型评估
    • 5.6影响因素分析
  • 六、随机森林模型
    • 6.1建立模型
    • 6.2模型评估
    • 6.3影响因素分析
  • 七、总结

一、绪论

背景描述

        随着年龄增长,脱发成为许多人关注的健康问题之一。头发的丰盈与否不仅影响着外貌,更与个体的健康状态息息相关。本数据集汇集了各种可能导致脱发的因素,包括遗传因素、荷尔蒙变化、医疗状况、药物治疗、营养缺乏、心理压力等。通过数据探索分析,深入挖掘这些因素与脱发之间的潜在关联,从而为个体健康管理、医疗干预以及相关产业的发展提供有益参考。
在这里插入图片描述

数据说明

字段说明
Id标识符
Genetics是否有秃头家族史(1:是 / 0:否)
Hormonal Changes是否经历了荷尔蒙变化
Medical Conditions可能导致秃头的病史;斑秃、甲状腺问题、头皮感染、银屑病、皮炎等
Medications & Treatments可能导致脱发的药物治疗史;化疗、心脏药物、抗抑郁药、类固醇等
Nutritional Deficiencies营养不足情况 ;铁缺乏、维生素D缺乏、生物素缺乏、Ω-3脂肪酸缺乏等
Stress压力水平
Age年龄
Poor Hair Care Habits是否存在不良的护发习惯
Environmental Factors是否暴露于可能导致脱发的环境
Smoking是否吸烟
Weight Loss是否经历了显著的体重减轻
Hair Loss是否脱发

病史

英文中文
Alopecia Areata斑秃
Androgenetic Alopecia雄激素型秃发
Dermatitis皮炎
Dermatosis皮肤病
Eczema湿疹
Psoriasis银屑病
Ringworm
Scalp Infection头皮感染
Seborrheic Dermatitis皮脂溢出性皮炎
Thyroid Problems甲状腺问题

药物治疗史

英文中文
Accutane治疗痤疮的药物
Antibiotics抗生素
Antidepressants抗抑郁药
Antifungal Cream杀菌霜
Blood Pressure Medication降血压药
Chemotherapy化疗
Heart Medication心脏药物
Immunomodulators免疫调节剂
Rogaine生发素
Steroids类固醇

营养不足

英文中文
Biotin Deficiency生物素缺乏
Iron deficiency铁缺乏
Magnesium deficiency镁缺乏
Omega-3 fatty acidsΩ-3脂肪酸
Protein deficiency蛋白质缺乏
Selenium deficiency硒缺乏
Vitamin A Deficiency维生素A缺乏
Vitamin D Deficiency维生素D缺乏
Vitamin E deficiency维生素E缺乏
Zinc Deficiency锌缺乏

压力水平

英文中文
Low
Moderate
High

内容大概

数据分析:

  1. 平均年龄是多少?
  2. 年龄的分布情况如何?
  3. 哪些医疗条件是最常见的?
  4. 它们的发生频率是多少?
  5. 营养缺乏的种类及其出现频率如何?

数据可视化:

  1. 不同年龄段中患者脱发的比例是多少?(柱状图或饼图)
  2. 哪些因素与脱发之间存在关联?(热力图或相关性图来呈现各因素之间的相关性)
  3. 不同压力水平下脱发的情况如何?(箱线图或分布图)

机器学习:

  1. 建立一个分类模型来预测个体是否会患上脱发,以基于给定的因素进行预测。
  2. 利用聚类分析,探索数据集中是否存在不同类型的脱发群体。
  3. 使用决策树或随机森林等算法,识别出最能预测脱发的关键因素是什么。

二、导入包以及数据读取

        导入一些常用的Python库,包括pandas、numpy、seaborn、matplotlib、scipy和statsmodels等用于数据处理、统计分析、可视化和机器学习。创建StandardScaler对象,用于数据标准化。最后数据集。

三、数据预览

查看数据维度

在这里插入图片描述

查看数据信息

在这里插入图片描述

查看各列缺失值

在这里插入图片描述

查看重复值

在这里插入图片描述

        数据集包含999条记录和13个字段,根据数据信息,所有列都没有缺失值,也没有发现重复的记录,这意味着数据集已经是干净且准备好进行进一步分析的状态。

基本统计量(连续变量)

在这里插入图片描述

        年龄的平均值为34.19岁,标准差为9.38,最小值为18岁,最大值为50岁。脱发情况:平均值为0.498,标准差为0.50,样本比较平衡,后续建立分类模型的时候,不用平衡样本了。

分类变量唯一值情况

在这里插入图片描述

可视化
在这里插入图片描述

        在此数据集中,有秃头家族史的人数大于没有秃头家族史的人数,经历了荷尔蒙变化的人数大于未经历荷尔蒙变化的人数,在压力水平中,显示了压力水平为“Low”、“Moderate”和“High”的比例,其中每一部分都占了相近的比例,显示受访者在压力水平上的分布较为均匀,秃头病史中,无数据和斑秃的人比较多,湿疹和癣的人比较少。

在这里插入图片描述

        可以看到数据集年龄是在18-50岁之间,其中20岁前后,38岁前后,50岁前这三个段的人数比较多,存在不良护发习惯的人略少于不存在不良护发习惯的人,认为自己暴露于可能导致脱发环境的人也略高于认为自己未暴露于可能脱发环境的人,其中使用过生发素、抗抑郁药、类固醇、心脏药物的人数比较多,无数据的人数最少。

在这里插入图片描述

        可以看到数据集吸烟的人数比不吸烟的人数多一些,没有经过过显著的体重减轻的人数更多一些,脱发与未脱发的人数分布比较均匀,后续建模的时候,不需要平衡样本了,缺乏锌、维生素D、生物素、维生素A的人数比较多。

四、探究导致脱发的因素

4.1可视化分析

  • 分析是否有秃头家族史与脱发的关系
  • 分析是否经历了荷尔蒙变化与脱发的关系
  • 分析可能导致秃头的病史与脱发的关系
  • 分析是否有秃头家族史与脱发的关系
  • 分析是否经历了荷尔蒙变化与脱发的关系
  • 分析可能导致秃头的病史与脱发的关系
    在这里插入图片描述

        从图中可以得知:本数据集中有秃头家族史的人比没有秃头家族史的人脱发占比更大,经历了荷尔蒙变化似乎不是导致脱发的一个原因,因为两类人群在脱发情况比较接近,患有斑秃、雄激素型秃发、皮脂溢出性皮炎的人比其他患者脱发的概率更大。

  • 分析压力水平与脱发的关系
  • 分析分析可能导致脱发的药物治疗史与脱发的关系
  • 分析年龄与脱发的关系
  • 分析分析压力水平与脱发的关系
  • 分析分析可能导致脱发的药物治疗史与脱发的关系

在这里插入图片描述

        从图中可以得知:不脱发的人比脱发的人年龄要大(中位数更高一点),中等压力的人比其他两类人占比更大,服用过类固醇、抗生素的人群脱发更高。

  • 分析不良的护发习惯与脱发的关系
  • 分析暴露于可能导致脱发的环境与脱发的关系
  • 分析吸烟与脱发的关系
  • 分析显著的体重减轻与脱发的关系
  • 分析营养不足情况与脱发的关系
  • 分析不良的护发习惯与脱发的关系
  • 分析暴露于可能导致脱发的环境与脱发的关系
  • 分析吸烟与脱发的关系
  • 分析显著的体重减轻与脱发的关系
  • 分析营养不足情况与脱发的关系

在这里插入图片描述

        从上图可知:存在不良护发习惯的人脱发占比,反而比不存在不良护发习惯的人低,暴露于可能脱发环境的人脱发占比也比未暴露于可能脱发环境的人低,吸烟的人更不容易脱发,经历过体重减轻的人更容易脱发,这些都挺出乎意料的,镁缺乏、蛋白质缺乏的人群更容易脱发。

        总言而之,通过可视化分析,可以认为:秃头家族史、患有不同的病、年龄、服用不同的药物、经历过体重减轻、缺乏某些微量元素等因素会影响脱发,其他的因素要么影响差异不大,要么违背我们的常识(如:存在不良护发习惯的人脱发占比,反而比不存在不良护发习惯的人低),这些需要我们通过其他的方法进一步探究。

4.2统计检验

  • 对脱发组进行KS检验
  • 对非脱发组进行KS检验

在这里插入图片描述

        因为两组数据(未脱发组和脱发组)的KS检验的p值<0.05,所以表明数据不能进行传统的独立样本t检验,可以使用曼-惠特尼U检验。

  • 曼-惠特尼U检验

在这里插入图片描述

        经过曼-惠特尼U检验,得到p值<0.05,表明脱发组和非脱发组在年龄变量上存在显著差异。

  • 分类变量进行卡方检验

        通过卡方检验,可以发现这些特征,没有一个与脱发存在统计学上的显著关联,这可能意味着脱发的原因更为复杂,或者可能需要考虑其他未包括在这个分析中的因素,因此,我们还需要建立统计模型来分析。

        通过进行卡方检验,我们可以对这些特征进行深入的分析和研究。然而,结果显示这些特征中没有一个与脱发存在统计学上的显著关联。这个发现引发了我们对脱发原因的进一步思考,暗示着脱发的原因可能比我们最初预期的更为复杂和多元。

        这种结果可能意味着,我们在分析中考虑的因素并不足以解释脱发的发生。这可能是因为还有一些其他重要的因素没有被包括在这个分析中,这些因素可能在脱发的发生中起着关键的作用。这些未被考虑的因素可能是一些我们尚未识别或理解的环境、遗传或生活方式因素。

        因此,我们需要建立一个更为全面和细致的统计模型来进行分析。这个模型应该包括更多的可能影响脱发的因素,以便我们能够更准确地理解脱发的原因。这个模型可能会包括更多的生物学、环境、生活方式和遗传因素,以便我们能够从多个角度来理解和解释脱发的发生。

五、逻辑回归模型

5.1数据预处理

  • 删除ID列
  • 将Yes替换成0,No替换成1
  • 替换压力(‘Low’: 1,‘Moderate’:2,‘High’:3)
  • 将名义变量(无序变量)进行杜热编码
  • Age 进行标准化
  • 对年龄进行标准化

在这里插入图片描述

5.2多重共线性检验

VIF结果
在这里插入图片描述

        因为对Medical Conditions,Medications & Treatments,Nutritional Deficiencies进行杜热编码后,导致新产生的特征列有无限大的方差膨胀因子,因此采取删除这三个特征生产的列,以Medical Conditions为例,这里选择删除Medical Conditions_No Data,这样不会影响数据结构,因为当其他的Medical Conditions列为0的时候,也就表示为No Data,同理,其他两个特征也是一样,独热编码后删除一列,我选择的都是数量最多的列。

VIF结果
可以发现,删除后,除了常数项的方差膨胀因子(VIF)>10,其他特征均在1-2之间,可以认为这个数据特征不存在多重共线性,因此可以使用逻辑回归模型。

        在对数据进行深入分析和处理的过程中,我们注意到了一个有趣的现象。当我们对数据进行删除操作后,我们发现大部分特征的方差膨胀因子(Variance Inflation Factor,简称VIF)都保持在1到2之间。这个范围通常被认为是可以接受的,因为它表明这些特征之间的多重共线性并不严重。

        然而,我们也注意到,有一个特殊的存在,那就是常数项的方差膨胀因子(VIF)。它的值大于10,这通常被认为是一个警示信号,表明可能存在多重共线性问题。但是,我们也需要明白,这个常数项的存在,是逻辑回归模型的一个基本组成部分,它代表了所有其他特征都为零时的概率。因此,即使其VIF值大于10,我们也不能简单地将其删除,因为这可能会影响模型的整体性能。

        总的来说,尽管常数项的VIF值大于10,但是考虑到其他特征的VIF值都在1-2之间,我们可以初步判断,这个数据集的特征并不存在严重的多重共线性问题。因此,我们可以安心地使用逻辑回归模型来进行后续的数据分析和建模工作。

5.3划分数据

x = new_data.drop('Hair Loss',axis=1)
y = new_data['Hair Loss']
x_train,x_test,y_train,y_test = train_test_split(x,y,test_size=0.2,random_state=15) 

5.4建立模型

在这里插入图片描述

5.5模型评估

在这里插入图片描述

混淆矩阵

混淆矩阵是一种用于评估分类模型性能的工具,它显示了模型在各个类别上的预测结果与实际结果之间的对应关系。

在这里插入图片描述

ROC曲线
在这里插入图片描述

逻辑回归模型评分如下:

  1. 精确度: 对于类别0,精确度为0.58,对于类别1,精确度为0.47。
  2. 召回率: 对于类别0,召回率为0.52,对于类别1,召回率为0.53。
  3. F1得分: 对于类别0,F1得分为0.55,对于类别1,F1得分为0.5。
  4. 准确率: 0.53
  5. ROC: 0.51

        模型的预测能力并不是特别好,这里我后面也采取了优化参数,但是效果不明显,感兴趣的读者可以去自己试着去优化参数。

5.6影响因素分析

通过对模型的系数进行分析,发现:患有皮脂溢出性皮炎、斑秃、雄激素型秃发这些病症的人,容易脱发,缺乏维生素A的人容易脱发(这里是负数,表明Nutritional Deficiencies _Vitamin A Deficiency越接近0,就表明不存在缺乏维生素A,越不容易脱发,反之,也就是缺乏维生素A越容易脱发)。

        在对模型的系数进行深入分析后,我们得到了一些关于脱发与相关疾病、营养状况之间关系的重要发现。这些发现为我们提供了关于哪些因素可能导致人们更容易脱发的宝贵信息。

        首先,我们发现患有某些特定皮肤疾病的人更容易出现脱发问题。具体来说,那些患有皮脂溢出性皮炎、斑秃或雄激素型秃发的人,他们的脱发风险相对较高。这些疾病可能直接影响头皮的健康和毛囊的功能,从而增加了脱发的风险。

        其次,我们还发现了一个与营养状况有关的有趣现象。那就是维生素A的摄入与脱发之间存在明显的关联。在我们的研究中,缺乏维生素A的人更容易出现脱发问题。这一点通过模型中的负数系数得到了体现。这里的“负数”意味着“Nutritional Deficiencies_Vitamin A Deficiency”的值越接近0,就表示该人不存在维生素A的缺乏,因此他们不容易脱发。反之,如果这个值较大,就表明该人缺乏维生素A,从而更容易出现脱发问题。

        维生素A在人体中扮演着多种重要角色,包括支持免疫系统、维持视力和促进细胞生长。它在维持头皮健康和毛发生长方面也起着关键作用。因此,维生素A的缺乏可能会影响头皮的健康,导致毛囊受损,进而增加脱发的风险。

        综上所述,我们的研究揭示了一些关键的脱发风险因素,包括某些皮肤疾病和维生素A的缺乏。这些发现为预防和治疗脱发提供了新的方向,强调了保持健康的皮肤和良好的营养状况在防止脱发方面的重要性。对于那些容易脱发的人来说,改善饮食,确保摄入足够的维生素A,以及及时就医治疗相关皮肤疾病,可能是减少脱发风险的有效方法。

六、随机森林模型

6.1建立模型

在这里插入图片描述

6.2模型评估

在这里插入图片描述

混淆矩阵
在这里插入图片描述

ROC曲线
在这里插入图片描述

随机森林模型评分如下:

  1. 精确度: 对于类别0,精确度为0.53,对于类别1,精确度为0.40。
  2. 召回率: 对于类别0,召回率为0.55,对于类别1,召回率为0.38。
  3. F1得分: 对于类别0,F1得分为0.54,对于类别1,F1得分为0.39。
  4. 准确率: 0.48。
  5. ROC: 0.49。

6.3影响因素分析

在这里插入图片描述

        通过对模型的影响度分析和统计检验的双重确认,我们确定年龄是影响模型预测的关键因素,这一发现将有助于我们在未来的工作中更好地理解和应用模型。

七、总结

        在本次研究中,我们采用了数据可视化和统计分析的方法,对影响脱发的各种因素进行了详尽的探索性分析。为了更准确地理解这些因素与脱发之间的关联,我们还构建了逻辑回归模型和随机森林模型。我们可以知道,脱发的主要影响因素包括年龄、患有皮脂溢出性皮炎、斑秃、雄激素型秃发等病症,以及缺乏维生素A。这些发现为我们理解和预防脱发提供了有价值的信息。


🔍 温馨提示
        如果对本文有任何疑问,欢迎点击下方名片,了解更多详细信息!


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/619362.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

萤火虫优化算法(Firefly Algorithm)

注意&#xff1a;本文引用自专业人工智能社区Venus AI 更多AI知识请参考原站 &#xff08;[www.aideeplearning.cn]&#xff09; 算法背景 萤火虫优化算法&#xff0c;是由剑桥大学的Xin-She Yang在2009年提出的一种基于群体智能的优化算法。它的灵感来源于萤火虫在夜晚闪烁…

[AIGC] 跳跃表是如何实现的?原理?

文章目录 什么是跳跃表查找流程&#xff1a;为什么使用跳跃表?跳跃表是怎么实现的&#xff1f; PS:跳跃表是比较常问的一种结构。 什么是跳跃表 Skip Lists: A Probabilistic Alternative to Balanced Trees 跳跃表是一种可以用来代替平衡树的数据结构。跳跃表使用概率平衡…

微服务核心01-Maven【项目管理工具】高级

一、分模块开发与设计&#xff08;重点⭐&#xff09; ssm_pojo 拆分 新建模块拷贝原始项目中对应的相关内容到 ssm_pojo 模块中 实体类 &#xff08;User&#xff09;配置 文件&#xff08;无&#xff09; ssm_dao 拆分 ssm_service 拆分 ssm_control 拆分 二、聚合&#xff…

齿轮滚刀刃口钝化技术简介

介绍 在滚刀的使用中发现&#xff0c;进口滚刀和国产滚刀在加工质量和寿命方面存在显著差异。经过多次比较得知&#xff0c;滚刀的使用寿命可以达到国产滚刀的两倍以上&#xff0c;而进口滚刀返回原厂磨削后的使用寿命约为新刀具的90% &#xff0c;但同样经过国内厂家磨削后&a…

第 1 天_二分查找【算法基础】

第 1 天_二分查找 前言34. 在排序数组中查找元素的第一个和最后一个位置题解官方33. 搜索旋转排序数组题解官方74. 搜索二维矩阵 前言 这是陈旧已久的草稿2021-11-09 19:33:44 当时在学习数据结构&#xff0c;然后再LeetCode上找了一个算法基础。 但是后来又没做了。 现在20…

1. 抓娃娃-二分

因为这个限制&#xff0c;所以不用担心线段比区间长 线段一定比区间短的话&#xff0c;想要判断是否线段的二分之一及以上在区间内&#xff0c;则可以转化为线段中点是否在区间内的问题 如果没有那个限制&#xff0c;那么就无法这么考虑了&#xff0c;因为即使中点在区间内&…

PUBG非升级实用枪皮-部分盘点

藏匿处的黑货箱武器需要耗费高额成本才能升级 对于像我这样的日常休闲玩家来说是一笔不小的&#xff08;巨大的&#xff01;&#xff09;负担 其实有许多普通非升级枪皮也是不错的选择 今天就来盘点一下我自己日常在用的普通皮 来看看你是不是也在用一样的 &#xff08;仅是盘点…

251 基于matlab的动态粒子群算法

基于matlab的动态粒子群算法。普通粒子群算法无法感知外界环境的变化&#xff0c;在外界环境发生改变时无法实时进行响应&#xff0c;因而缺乏动态环境寻优能力。在普通粒子群算法基本上通过增加敏感粒子得到一种动态粒子群算法&#xff0c;该算法通过实时计算敏感粒子的适应度…

系统权限控制插件封装-实现系统权限控制插件化

背景&#xff1a;按照传统的开发方式方式&#xff0c;每次新开发一个系统&#xff0c;就需要花费大量时间精力去搭建权限控制模块&#xff0c;如果我们把权限控制这一整个模块都抽离成一个独立的权限控制插件&#xff0c;支持单命令安装&#xff0c;全面暴露参数与方法&#xf…

【算法】竞赛常用知识之字符串1

前言&#xff1a; 本系列是学习了董晓老师所讲的知识点做的笔记 董晓算法的个人空间-董晓算法个人主页-哔哩哔哩视频 (bilibili.com) 动态规划系列&#xff08;还没学完&#xff09; 【算法】动态规划之线性DP问题-CSDN博客 【算法】动态规划之背包DP问题&#xff08;2024…

Linux中云盘/磁盘,爆满处理方式

1&#xff1a;du和df命令查看磁盘大小不一致 以下是阿里云服务器云盘使用率 运行 du -sh / 大小为20g 我的服务器大小为40g 按道理说这个云盘使用率应该是百分之五十 而运行 df -h / 这个命令是跟这个云盘使用率差不多的。 1.1分析原因 我安装了mysql&#xff0c;nginx…

47岁古天乐唯一承认女友约「御用阿妈」过母亲节

日前关宝慧在IG晒出一张聚会照&#xff0c;并写道&#xff1a;「预祝各位#母亲节快乐&#x1f339;#dinner #happy #friends #好味」相中所见&#xff0c;前TVB金牌监制潘嘉德、卢宛茵、黄&#x28948;莹、黎萨达姆都有出席饭局。 当中黄&#x28948;莹身穿卡其色西装褛&…

从“制造”到“智造”:“灯塔”经验助力中国制造业转型升级-转载

作者&#xff1a;Karel Eloot&#xff0c;侯文皓&#xff0c;Francisco Betti&#xff0c;Enno de Boer和Yves Giraud 作为中国实体经济的主体&#xff0c;制造业是推动中国经济发展乃至全球制造业持续增长的重要引擎。站在历史与未来交汇的新起点上&#xff0c;中国制造业将背…

ERP与MES与WMS集成

WMS储位管理 WMS与MES集成 (一) 打通追溯链 在拣货时&#xff0c;将配料标签与供应商的物料标签进行关联。通过配料标签达到精确追溯及防错目的。针对模糊查询&#xff0c;将工单与物料的供应商信息、仓库流转信息进行关联。 (二) WMS入库 成品(半成品)下线后&#xff0c;M…

MySQL查询篇-聚合函数-窗口函数

文章目录 distinct 关键字聚合函数常见的聚合函数group by和having 分组过滤 窗口函数with as窗口聚合函数排名窗口函数值窗口函数 distinct 关键字 distinct 去重数据&#xff0c;ps:null值也会查出来 select distinct column from table;聚合函数 常见的聚合函数 select …

【前端系列】什么是yarn

&#x1f49d;&#x1f49d;&#x1f49d;欢迎来到我的博客&#xff0c;很高兴能够在这里和您见面&#xff01;希望您在这里可以感受到一份轻松愉快的氛围&#xff0c;不仅可以获得有趣的内容和知识&#xff0c;也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…

浅谈@Controller注解和其他四大注解的区别

各位大佬光临寒舍&#xff0c;希望各位能赏脸给个三连&#xff0c;谢谢各位大佬了&#xff01;&#xff01;&#xff01; 目录 1.Spring五大注解的使用约定 2.Controller注解的特别之处 3.总结 1.Spring五大注解的使用约定 Spring的五大注解&#xff08;Controller&#x…

【无标题】能效?性能?一个关于openssl speed速度测试的诡异问题。

问题描述 最近的某个软件用到了openssl&#xff0c;所以就想着测试一下速度。我的电脑是惠普的&#xff0c;CPU是AMD Ryzen 7 PRO 6850HS&#xff0c;系统是Win11。我使用openssl自带的speed测试加密/解密的速度&#xff0c;命令大致如下&#xff1a; openssl speed -evp aes…

python数据分析——matplotlib可视化基础

参考资料&#xff1a;活用pandas库 # 导入库 import pandas as pd import matplotlib.pyplot as plt # 导入数据 anscombepd.read_csv(r"...\seaborn常用数据案例\anscombe.csv") anscombe.head() 大多数基本图表的名字以plt.plot开头。 # 创建数据子集 # 只包含数…

电力场景设备漏油检测数据集VOC+YOLO格式338张1类别

数据集格式&#xff1a;Pascal VOC格式YOLO格式(不包含分割路径的txt文件&#xff0c;仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数)&#xff1a;338 标注数量(xml文件个数)&#xff1a;338 标注数量(txt文件个数)&#xff1a;338 标注类别…