数学建模 —— 聚类分析(3)

目录

一、聚类分析概述

1.1 常用聚类要素的数据处理

1.1.1 总和标准化

1.1.2 标准差标准化

1.1.3  极大值标准化

1.1.4 极差的标准化

1.2 分类

1.2.1 快速聚类法(K-均值聚类)

1.2.2 系统聚类法(分层聚类法)

二、分类统计量距离

2.1 明式(Minkowski)距离

 2.2 马氏(Mahalanobis)距离

2.3 兰氏(Canberra)距离

三、常用的聚类方法

 3.1 最短距离法

 3.2 最长距离法

 3.3 中间距离法

 3.4 重心法

 3.5 类平均法

 3.6 离差平方和法

四、Matlab进行聚类

五、SPSS步骤


一、聚类分析概述

        聚类分析根据一批样品的许多观测指标,按照一定的数学公式具体地计算一些样品或一些参数(指标)的相似程度,把相似的样品或指标归为一类,把不相似的归为一类。

        在聚类分析中,聚类要素的选择是十分重要的,它直接影响分类结果的准确性和可靠性。而为了使不同量纲,不同取值范围的数据能够放在一起进行比较,在进行聚类分析之前,首先要对聚类要素进行数据处理。

1.1 常用聚类要素的数据处理

1.1.1 总和标准化

        分别求出各聚类要素所对应的数据的总和,以各要素的数据除以该要素的数据的总和,即

        这种标准化方法所得到的新数据满足

1.1.2 标准差标准化

 由这种标准化方法所得到的新数据,各要素的平均值为0,标准差为1,即有

1.1.3  极大值标准化

 经过这种标准化所得的新数据,各要素的极大值为1,其余各数值小于1

1.1.4 极差的标准化

 经过这种标准化所得的新数据,各要素的极大值为1,极小值为0,其余的数值均在01之间。 

1.2 分类

1.2.1 快速聚类法(K-均值聚类)

        基本思想开始时按照一定方法选取一批凝聚点,然后让样本向最近的凝聚点聚类,形成初始分类,之后再按照最近距离原则修改不合理的分类,直到合理为止。

        快速聚类过程是寻找初始分类的有效方法,采用的算法是最小化与类均值间距离平方和的标准迭代算法,其结果是高效率地生成大数据文件的不相交的分类

1.2.2 系统聚类法(分层聚类法)

        系统聚类分析就是通过对变量的测量,将比较接近的样本找出来归为一类,进一步再将比较接近的类合并成为新的类,逐层合并直到最后合并成为一类。
        系统聚类产生的结果不在聚类的开始,也不在聚类的最终,而是在其过程中。研究者将根据聚类过程适当截取聚类结论。

系统聚类的一般程序

首先,不论是定量数据还是定性数据,都应确定分类统计量,用以测定样本之间的亲疏程度,主要通过样本之间的距离、样本间的相关系数来确定;   

分类统计量:样本间的距离或相关系数

其次,利用统计量将样品进行分类。

二、分类统计量距离

2.1 明式(Minkowski)距离

 2.2 马氏(Mahalanobis)距离

2.3 兰氏(Canberra)距离

 2.相关系数

三、常用的聚类方法

八种聚类计算距离的递推公式最短距离法、最长距离法、中间距离法、重心法、类平均法、可变类平均法、可变法、离差平方和法

3.1 最短距离法

步骤:

 3.2 最长距离法

 3.3 中间距离法

 3.4 重心法

 3.5 类平均法

 3.6 离差平方和法

四、Matlab进行聚类

 

五、SPSS步骤

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/671879.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Ubuntu18.04安装pwntools报错解决方案

报错1:ModuleNotFoundError: No module named ‘setuptools_rust’ 报错信息显示ModuleNotFoundError: No module named setuptools_rust,如下图所示 解决方案:pip install setuptools_rust 报错2:pip版本低 解决方案&#xff…

【数据结构(邓俊辉)学习笔记】图02——搜索

文章目录 0. 概述1. 广度优先搜索1.1 策略1.2 实现1.3 可能情况1.4 实例1.5 多联通1.6 复杂度1.7 最短路径 2. 深度优先搜索2.1 算法2.2 框架2.3 细节2.4 无向边2.5 有向边2.6 多可达域2.7 嵌套引理 3 遍历算法的应用 0. 概述 此前已经介绍过图的基本概念以及它在计算机中的表…

设计模式(十四)行为型模式---访问者模式(visitor)

文章目录 访问者模式简介分派的分类什么是双分派?结构UML图具体实现UML图代码实现 优缺点 访问者模式简介 访问者模式(visitor pattern)是封装一些作用于某种数据结构中的元素的操作,它可以在不改变这个数据结构(实现…

Visual Studio Installer 点击闪退

Visual Studio Installer 点击闪退问题 1. 问题描述2. 错误类型3. 解决方法4. 结果5. 说明6. 参考 1. 问题描述 重装了系统后(系统版本:如下图所示),我从官方网站(https://visualstudio.microsoft.com/ ) 下载了安装程…

Three.js-实现加载图片并旋转

1.实现效果 2. 实现步骤 2.1创建场景 const scene new THREE.Scene(); 2.2添加相机 说明: fov(视场角):视场角决定了相机的视野范围,即相机可以看到的角度范围。较大的视场角表示更广阔的视野,但可能…

如何在镜像中安装固定版本的node和npm

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、使用 Dockerfile 创建自定义镜像二、如何安装固定版本的node及npm总结 前言 最近在做前端工程化相关的内容,需要在一个镜像内安装固定版本的 N…

Microservices with Martin Fowler

Summary The article “Microservices” by Martin Fowler discusses an architectural style for software systems that has been gaining popularity due to its flexibility and scalability. Here’s a summary highlighting the key points: Microservice Architectural…

十_信号4-SIGCHLD信号

SIGCHLD信号 在学习进程控制的时候,使用wait和waitpid系统调用何以回收僵尸进程,父进程可以阻塞等待,也可以非阻塞等待,采用轮询的方式不停查询子进程是否退出。 采用阻塞式等待,父进程就被阻塞了,什么都干…

【魅力网页的背后】:CSS基础魔法,从零打造视觉盛宴

文章目录 🚀一、css基础知识⭐1. 认识css 🌈二、选择器初级❤️id与class命名 🚀一、css基础知识 ⭐1. 认识css 概念 CSS(英文全称:Cascading Style Sheets),层叠样式表。它是网页的装饰者,用来修饰各标签…

YOLOv5改进(六)--引入YOLOv8中C2F模块

文章目录 1、前言2、C3模块和C2F模块2.1、C3模块2.2、BottleNeck模块2.3、C2F模块 3、C2F代码实现3.1、common.py3.2、yolo.py3.3、yolov5s_C2F.yaml 4、目标检测系列文章 1、前言 本文主要使用YOLOv8的C2F模块替换YOLOv5中的C3模块,经过实验测试,发现Y…

深圳雷龙LSYT201B语音控制模组

文章目录 前言一、芯片简介处理器外设音频蓝牙电源封装温度 二、功能简介管脚描述 三、应用场景四、使用说明五、硬件连接六、FAQ总结 前言 今天拿到的语音控制板是LSYT201B模组,它是深圳市雷龙发展有限公司基于YT2228芯片开发的一款面向智能家居控制的离线语音控制…

SSM高校社团管理系统-计算机毕业设计源码86128

目 录 摘要 1 绪论 1.1研究背景与意义 1.2开发现状 1.3研究方法 1.4 ssm框架介绍 1.5论文结构与章节安排 2 高校社团管理系统系统分析 2.1 可行性分析 2.2 系统流程分析 2.2.1数据增加流程 2.2.2数据修改流程 2.2.3数据删除流程 2.3 系统功能分析 2.3.1 功能性分…

大模型部署_书生浦语大模型 _作业2基本demo

本节课可以让同学们实践 4 个主要内容,分别是: 1、部署 InternLM2-Chat-1.8B 模型进行智能对话 1.1安装依赖库: pip install huggingface-hub0.17.3 pip install transformers4.34 pip install psutil5.9.8 pip install accelerate0.24.1…

类和对象(一)(C++)

类和对象: 类的引入: C语言结构体中只能定义变量,在C中,结构体内不仅可以定义变量,也可以定义函数。比如: 之前在数据结构初阶中,用C语言方式实现的栈,结构体中只能定义变量&#…

Java | Leetcode Java题解之第123题买卖股票的最佳时机III

题目&#xff1a; 题解&#xff1a; class Solution {public int maxProfit(int[] prices) {int n prices.length;int buy1 -prices[0], sell1 0;int buy2 -prices[0], sell2 0;for (int i 1; i < n; i) {buy1 Math.max(buy1, -prices[i]);sell1 Math.max(sell1, b…

Docker最新超详细版教程通俗易懂

文章目录 一、Docker 概述1. Docker 为什么出现2. Docker 的历史3. Docker 能做什么 二、Docker 安装1. Docker 的基本组成2. 安装 Docker3. 阿里云镜像加速4. 回顾 hello-world 流程5. 底层原理 三、Docker 的常用命令1. 帮助命令2. 镜像命令dokcer imagesdocker searchdocker…

【C++ 初阶】内联函数 inline 与 宏定义的区别!

文章目录 1. 内联函数2. 内联函数和宏定义的区别3. 宏函数4. 宏的优缺点5. 小扩展 1. 内联函数 &#x1f34e; 概念 以inline修饰的函数叫做内联函数&#xff0c;编译时C编译器会在调用内联函数的地方展开&#xff0c;没有函数调用建立栈帧的开销&#xff0c;内联函数提升程序…

RabbitMQ三、springboot整合rabbitmq(消息可靠性、高级特性)

一、springboot整合RabbitMQ&#xff08;jdk17&#xff09;&#xff08;创建两个项目&#xff0c;一个生产者项目&#xff0c;一个消费者项目&#xff09; 上面使用原生JAVA操作RabbitMQ较为繁琐&#xff0c;很多的代码都是重复书写的&#xff0c;使用springboot可以简化代码的…

十_信号3-可重入函数

如上图所示链表&#xff0c;在插入节点的时候捕获到了信号&#xff0c;并且该信号的自定义处理方式中也调用了插入节点的函数。 在main函数中&#xff0c;使用insert向链表中插入一个节点node1&#xff0c;在执行insert的时&#xff0c;刚让头节点指向node1以后(如上图序号1)&…

④单细胞学习-cellchat细胞间通讯

目录 1&#xff0c;原理基础 流程 受体配体概念 方法比较 计算原理 2&#xff0c;数据 3&#xff0c;代码运行 1&#xff0c;原理基础 原文学习Inference and analysis of cell-cell communication using CellChat - PMC (nih.gov) GitHub - sqjin/CellChat: R toolk…