乳腺癌诊断分析——基于聚类分析实现

一、研究背景

乳腺癌属于恶性肿瘤,在早期发现后需要及早将病变组织切除,而且术后还要化疗和放射等辅助治疗,能够抑制癌细胞的扩散和增长。

二、研究目的

  1. 研究乳腺癌病人的患病特征
  2. 通过聚类分析方法对特征进行分类
  3. 通过上述聚类结果对乳腺诊断给出建议

三、数据来源

机器学习(sklearn)库中美国威斯康星州乳腺癌的数据集,包含乳腺癌患者的肿瘤特征的测量值。 

breast_cancer — scikit-learnicon-default.png?t=O83Ahttps://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_breast_cancer.html

四、实验仪器

Windows 11,SPSS,PyCharm Professional,R,Jupyter Notebook

五、数据集介绍

 

5.1 数据来源

本实验数据来自机器学习中美国威斯康星州乳腺癌数据集,包含569个患有乳腺癌的人群。 

5.2 选择的病理特征

  1. 平均半径
  2. 平均纹理
  3. 平均周长
  4. 平均面积
  5. 平均平滑度
  6. 平均紧凑度
  7. 平均凹度
  8. 平均对称性
  9. 平均分形 

六、系统聚类法

6.1 近似值矩阵

 本实验使用SPSS进行操作,本文在计算距离时采用平方欧式距离,所以样品间距离越大,样品差异越大。而在计算类与类之间的距离时,本文采用的是最短距离法,在SPSS中对应为最近邻元素。如下表所示,平均周长与平均半径间距离最小,最先聚为一类。

6.2  集中趋势

 上表为SPSS输出聚类系数表,接下来使用Python进行绘图得到下面的折线图。

6.3 聚合系数与谱系图

由图1得出,当分类数大于4时,曲线的变化趋于平稳,为此分类数等于4符合分类目的。最后使用SPSS 绘制出了系统聚类的谱系图,如图2所示。

 

 通过谱系图得出四类的特征分别为:

  1. 第一类为平均半径,平均周长,平均面积,平均凹度,平均对称性,平均紧凑度,刻画了乳腺的表面特征,通过表面特征地识别出乳腺癌的患病前兆;
  2. 第二类为平均平滑度,识别诊断出乳腺癌;
  3. 第三类为平均分形,刻画了乳腺的内在因素对乳腺癌的患病前兆的识别;
  4. 第四类为平均纹理,刻画乳腺的纹理形状对乳腺癌诊断识别的重要性。

七、总结与建议

7.1 总结 

  1. 通过聚类结果,我们总结发现乳腺癌的四类病理特征: 平均半径,平均周长,平均面积,平均凹度,平均对称性;平均紧凑度; 平均平滑度; 平均分形; 平均纹理;
  2. 通过对病人的上述四类病理特征进行检测,则可以帮助初步判断乳腺癌;
  3. 在数据较少或者缺失的时候可以从这四类的特征初步判断其乳腺癌的风险。

7.2 建议

1、建立良好的生活方式,调整好生活节奏,保持心情舒畅。

2、坚持体育锻炼,积极参加社交活动,避免和减少精神、心理紧张因素,保持心态平和。

3、养成良好的饮食习惯。

  • 婴幼儿时期注意营养均衡,提倡母乳喂养。
  • 儿童发育期减少摄入过量的高蛋白和低纤维饮食。
  • 青春期不要大量摄入脂肪和动物蛋白,加强身体锻炼。
  • 绝经后控制总热量的摄入,避免肥胖。
  • 平时养成不过量摄入肉类、煎蛋、黄油、奶酪、甜食等饮食习惯,少食腌、熏、炸、烤食品,增加食用新鲜蔬菜、水果、维生素、胡萝卜素、橄榄油、鱼、豆类制品等。

4、积极治疗乳腺疾病。

5、不乱用外源性雌激素。

6、不长期过量饮酒。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/915657.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

丹摩征文活动|FLUX.1 和 ComfyUI:从部署到上手,轻松驾驭!

FLUX.1 和 ComfyUI:从部署到上手,轻松驾驭! FLUX.1历史曲线 黑森林实验室推出了一款名为FLUX.1的先进图像生成模型,根据不同用户需求,提供了三种独特的版本。 FLUX.1-pro:作为专为企业打造的强大闭源版本…

数据分析:16s差异分析DESeq2 | Corncob | MaAsLin2 | ALDEx2

禁止商业或二改转载,仅供自学使用,侵权必究,如需截取部分内容请后台联系作者! 文章目录 介绍DESeq2原理计算步骤结果Corncob原理计算步骤结果MaAsLin2原理计算步骤结果ALDEx2原理计算步骤结果加载R包数据链接数据预处理微生物数据样本信息提取物种名称过滤零值保留结果读取…

OCR识别铁路电子客票

随着中国铁路客运领域进入全面数字化时代,国家税务总局、财政部和国铁集团于2024年10月18日联合发布公告,自2024年11月1日起,推广使用“电子发票(铁路电子客票)”。这一举措不仅为旅客出行提供了极大的便利&#xff0c…

【MySQL基础刷题】总结题型(三)

十题左右,便于复习 1.查询结果的质量和占比2.每月交易I3.销售分析III4.只出现一次的最大数字5.买下所有产品的客户6.员工的直属部门7.指定日期的产品价格 1.查询结果的质量和占比 avg大神啊… SELECT query_name, ROUND(avg(rating / position), 2) as quality, …

python 同时控制多部手机

在这个智能时代,我们的手机早已成为生活和工作中不可或缺的工具。无论是管理多个社交媒体账号,还是处理多台设备上的事务,如何更高效地控制多个手机成为了每个人的痛点。 今天带来的这个的软件为你提供了一键控制多部手机的强大功能。无论是办公、娱乐,还是社交,你都能通过…

外星人入侵

学习于Python编程从入门到实践(Eric Matthes 著) 整体目录:外星人入侵文件夹是打包后的不必在意 图片和音效都是网上下载的 音效下载网站:Free 游戏爆击中 Sound Effects Download - Pixabay 运行效果:可以上下左右移…

前端监控与埋点 全总结

一、概念 前端埋点是指在网页或者应用程序中插入特定的代码,用于收集用户的行为数据并发送给服务器进行分析。这些数据可以包括用户的点击、浏览、输入等操作,帮助开发者了解用户的在其网站中的行为,从而进行针对性的优化和改进。 前端埋点…

Python简单文件操作day9

1、文件操作的重要性和场景 重要性: 数据持久化、跨平台兼容性、数据备份与恢复、数据共享、配置管理、日志记录 应用场景: 数据分析、web开发、文本处理 2、文件的概念 文件是一个存储在某种持久性存储介质【硬盘、光盘、磁盘等】上的数据的结合。 …

指令存储和指令流水线

要求存储器的编址单位,首先观察到计算机采用的是32位定长指令字,因此一条指令就是32位,即4B,根据表中可知一条指令所占地址空间为08048104H-08048100H4H,因此所用的编制单位为字节(B) 将所有指令…

kafka管理工具

文章目录 前言一、Kafka Assistan1.1 描述1.2、配置安装 二、Conduktor2.1、描述2.2、配置安装 三、kafka-maneger3.1、描述3.2、配置安装3.3、命令启动3.4、[refer to](https://www.ctyun.cn/document/10000120/10033218#section-39755766f4910e4b) 前言 提示:这里…

JavaWeb常见注解

1.Controller 在 JavaWeb 开发中,Controller是 Spring 框架中的一个注解,主要用于定义控制器类(Controller),是 Spring MVC 模式的核心组件之一。它表示该类是一个 Spring MVC 控制器,用来处理 HTTP 请求并…

axios平替!用浏览器自带的fetch处理AJAX(兼容表单/JSON/文件上传)

fetch 是啥? fetch 函数是 JavaScript 中用于发送网络请求的内置 API,可以替代传统的 XMLHttpRequest。它可以发送 HTTP 请求(如 GET、POST 等),并返回一个 Promise,从而简化异步操作 基本用法 /* 下面是…

window任务计划记录中显示操作成功,但是代码只执行了第一句命令

一、创建定时任务 1. Windows键R 调出此窗口,输入compmgmt.msc (调用的是计算机管理) 2. 创建基本任务 在任务计划程序中右键 选择 创建基本任务。 输入任务名称及描述。 下一步中选择触发器的时间,这里选择每天。 选择开始时间&…

使用VSCode远程连接服务器并解决Neo4j无法登陆问题

摘要:本文介绍了如何通过VSCode连接内网部署的Neo4j服务器,并启动服务。在访问Neo4j登录界面时,遇到了端口映射问题导致无法登录。通过手动添加7687端口的映射后,成功登录Neo4j。 我在内网部署了一台服务器,并在其上运…

【异常解决】Linux shell报错:-bash: [: ==: 期待一元表达式 解决方法

博主介绍:✌全网粉丝21W,CSDN博客专家、Java领域优质创作者,掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域✌ 技术范围:SpringBoot、SpringCloud、Vue、SSM、HTML、Nodejs、Python、MySQL、PostgreSQL、大数据、物…

游戏引擎学习第四天

视频参考:https://www.bilibili.com/video/BV1aDmqYnEnc/ BitBlt 是 Windows GDI(图形设备接口)中的一个函数,用于在设备上下文(device context, DC)之间复制位图数据。BitBlt 的主要用途是将一个图像区域从一个地方复…

七牛云上传图片成功,但是无法访问显示{error : document not found}

上传图片成功,但是访问不了的问题,直接把地址放进浏览器显示{error : document not found},直接访问 DCNF 404是符合预期的,因为还没有去空间复制外链,要访问实际存在的资源才可以的. 配置区域和访问域名 设置没问题了…

通过投毒Bingbot索引挖掘必应中的存储型XSS

简介 在本文中,我将讨论如何通过从外部网站对Bingbot进行投毒,来在Bing.com上实现持久性XSS攻击。 什么是存储型或持久性XSS?存储型攻击指的是将恶意脚本永久存储在目标服务器上,例如数据库、论坛、访问日志、评论栏等。受害者在…

84.7k Star!Excalidraw:开源的在线白板工具,具备手绘风格和实时协作功能

❤️ 如果你也关注大模型与 AI 的发展现状,且对大模型应用开发非常感兴趣,我会快速跟你分享最新的感兴趣的 AI 应用和热点信息,也会不定期分享自己的想法和开源实例,欢迎关注我哦! 🥦 微信公众号&#xff…

让Git走代理

有时候idea提交代码或者从github拉取代码,一直报错超时或者:Recv failure: Connection was reset,下面记录一下怎么让git走代理从而访问到github。 1.打开梯子 2.打开网络和Internet设置 3.设置代理 记住这个地址和端口 4.打开git bash终端 输入以下内容 git c…