欧氏距离、曼哈顿距离、切比雪夫距离、闵可夫斯基距离、马氏距离理解学习

目录

    • 一、欧氏距离(Euclidean Distance)
      • 公式:
      • 原理:
    • 二、曼哈顿距离(Manhattan Distance)
      • 公式:
      • 原理:
    • 三、切比雪夫距离(Chebyshev Distance)
      • 公式:
      • 原理:
    • 四、闵可夫斯基距离(Minkowski Distance)
      • 公式:
      • 原理:
    • 五、马氏距离(Mahalanobis Distance)
      • 公式:
      • 原理:

一、欧氏距离(Euclidean Distance)

欧氏距离是最常见的距离度量之一,用于计算两个点之间的直线距离。

公式:

对于二维空间中的两个点   P ( x 1 , y 1 ) \ P(x_1, y_1)  P(x1,y1)   Q ( x 2 , y 2 ) \ Q(x_2, y_2)  Q(x2,y2)

d ( P , Q ) = ( x 2 − x 1 ) 2 + ( y 2 − y 1 ) 2 d(P, Q) = \sqrt{(x_2 - x_1)^2 + (y_2 - y_1)^2} d(P,Q)=(x2x1)2+(y2y1)2

  n \ n  n 维空间中(   P n ( x 1 , x 2 , . . . , x n ) \ P_n(x_1,x_2,...,x_n)  Pn(x1,x2,...,xn);   Q n ( y 1 , y 2 , . . . , y n ) \ Q_n(y_1,y_2,...,y_n)  Qn(y1,y2,...,yn)),计算公式为:
d ( P , Q ) = ∑ i = 1 n ( x i − y i ) 2 d(P, Q) = \sqrt{\sum_{i=1}^{n} (x_i - y_i)^2} d(P,Q)=i=1n(xiyi)2
在这里插入图片描述
注意是n维,而不是n个点,就是我们从初中到高中经常用到的距离公式!

原理:

  • 计算两点间的直线最短路径
  • 适用于几何计算机器学习中的距离计算。

二、曼哈顿距离(Manhattan Distance)

曼哈顿距离度量的是沿坐标轴方向的距离,而非直线距离。

公式:

对于二维空间中的两个点   P ( x 1 , y 1 ) \ P(x_1, y_1)  P(x1,y1)   Q ( x 2 , y 2 ) \ Q(x_2, y_2)  Q(x2,y2)

d ( P , Q ) = ∣ x 2 − x 1 ∣ + ∣ y 2 − y 1 ∣ d(P, Q) = |x_2 - x_1| + |y_2 - y_1| d(P,Q)=x2x1+y2y1

  n \ n  n 维空间中,公式为:

d ( P , Q ) = ∑ i = 1 n ∣ x i − y i ∣ d(P, Q) = \sum_{i=1}^{n} |x_i - y_i| d(P,Q)=i=1nxiyi

原理:

  • 适用于网格状城市(如曼哈顿街道)。
  • 仅允许水平或垂直方向的移动。
    在这里插入图片描述

三、切比雪夫距离(Chebyshev Distance)

切比雪夫距离计算的是最大坐标轴差异,适用于棋盘格场景。

公式:

对于二维空间中的两个点   P ( x 1 , y 1 ) \ P(x_1, y_1)  P(x1,y1)   Q ( x 2 , y 2 ) \ Q(x_2, y_2)  Q(x2,y2)

d ( P , Q ) = max ⁡ ( ∣ x 2 − x 1 ∣ , ∣ y 2 − y 1 ∣ ) d(P, Q) = \max(|x_2 - x_1|, |y_2 - y_1|) d(P,Q)=max(x2x1,y2y1)

  n \ n  n 维空间中,公式为:

d ( P , Q ) = max ⁡ i = 1 n ∣ x i − y i ∣ d(P, Q) = \max_{i=1}^n |x_i - y_i| d(P,Q)=i=1maxnxiyi

原理:

  • 适用于国际象棋中的国王移动(八个方向)。
  • 计算最短步数时较为常见。

四、闵可夫斯基距离(Minkowski Distance)

闵可夫斯基距离是欧氏距离和曼哈顿距离的广义形式,通过调整参数   p \ p  p 来控制计算方式。

公式:

对于   n \ n  n 维空间中的两个点:

d ( P , Q ) = ( ∑ i = 1 n ∣ x i − y i ∣ p ) 1 p d(P, Q) = \left( \sum_{i=1}^{n} |x_i - y_i|^p \right)^{\frac{1}{p}} d(P,Q)=(i=1nxiyip)p1

  •   p = 1 \ p = 1  p=1 时,闵可夫斯基距离等于曼哈顿距离
  •   p = 2 \ p = 2  p=2 时,闵可夫斯基距离等于欧氏距离

原理:

  • 适用于灵活调整不同计算方式的场景。
  • 通过改变   p \ p  p 值,可适配不同任务。

五、马氏距离(Mahalanobis Distance)

马氏距离是一种考虑数据分布的距离度量方式,它不仅计算点之间的距离,还考虑变量的协方差关系

公式:

对于两个点   P \ P  P   Q \ Q  Q,马氏距离定义为:

d ( P , Q ) = ( P − Q ) T Σ − 1 ( P − Q ) d(P, Q) = \sqrt{(P - Q)^T \Sigma^{-1} (P - Q)} d(P,Q)=(PQ)TΣ1(PQ)

其中:

  •   Σ − 1 \ \Sigma^{-1}  Σ1 为数据的协方差矩阵的逆

原理:

  • 适用于多维数据分析,考虑特征之间的相关性。
  • 常用于异常检测和**主成分分析(PCA)**等领域。

不同的距离度量方法适用于不同的任务场景,选择合适的距离计算方式能提高算法的效果!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/979694.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

计算机三级网络技术备考(3)

【知识点补充:带宽是是链路的传输速率,宽带是一种服务】 第四章:路由设计技术 考点1:IP路由选择与路由汇聚 核心层:s0两个IP进行汇聚就行 汇聚层:聚合后两个以上的往前进几位(因为主机号不够因…

互联网医院实时数据监测智能分析系统设计概述(下)

阶段4:可视化仪表盘与用户界面开发 在这一阶段,我们将使用 Plotly Dash 来设计一个实时预测仪表盘,用于展示疾病传播趋势、医生评估信息等。我们还将实现实时数据更新与展示,确保数据能够及时反映系统中的变化。 1. 设计实时预测仪表盘 步骤 1:安装 Dash 依赖 首先,确…

VMware vSphere数据中心虚拟化——vCenter Server6.7创建配置数据中心集群

VMware vSphere数据中心虚拟化 vCenter Server6.7创建配置数据中心集群前期准备创建配置数据中心集群分配许可证 vCenter Server6.7创建配置数据中心集群 前期准备 已部署完成vCenter7.0集群为vSAN存储和vSphereHA高可用 提前规划好专属网络地址每台物理机至少提供两块硬盘&a…

【算法学习之路】4.简单数论(4)

简单数论(4) 前言三.高精度1.什么是高精度2.解决办法 精度乘除法一.精度乘法1.数据的存储2.步骤3.例题:高精度乘法 二.精度除法1.例子2.步骤3.例题:高精度除法 前言 我会将一些常用的算法以及对应的题单给写完,形成一套…

视频推拉流EasyDSS点播平台云端录像播放异常问题的排查与解决

EasyDSS视频直播点播平台是一个功能全面的系统,提供视频转码、点播、直播、视频推拉流以及H.265视频播放等一站式服务。该平台与RTMP高清摄像头配合使用,能够接收无人机设备的实时视频流,实现无人机视频推流直播和巡检等多种应用。 最近&…

pyQT5简易教程(一):制作一个可以选择本地图片并显示的桌面应用

可以参考之前的教程安装 PyQt 和 PyQt Designer https://blog.csdn.net/smx6666668/article/details/145909326?spm=1011.2415.3001.10575&sharefrom=mp_manage_link 一、打开pycharm中的QTdesigner 二、设计界面 和之前一样,使用 PyQt Designer 来设计界面并保存为 .u…

【洛谷贪心算法】P1090合并果子

为了使消耗的体力最小,每次都应该选择当前重量最小的两堆果子进行合并。可以使用优先队列(小根堆)来实现这个过程,优先队列可以自动维护元素的顺序,每次取出堆顶的两个元素(即最小的两个元素)进…

第四届大数据、区块链与经济管理国际学术会议

重要信息 官网:www.icbbem.com 时间:2025年3月14-16日 地点:中国-武汉 (线上召开) 简介 第四届大数据、区块链与经济管理国际学术会议(ICBBEM 2025),将于2025年3月14-16日在中国湖北省武汉市召开。…

【愚公系列】《Python网络爬虫从入门到精通》037-文件的存取

标题详情作者简介愚公搬代码头衔华为云特约编辑,华为云云享专家,华为开发者专家,华为产品云测专家,CSDN博客专家,CSDN商业化专家,阿里云专家博主,阿里云签约作者,腾讯云优秀博主,腾讯云内容共创官,掘金优秀博主,亚马逊技领云博主,51CTO博客专家等。近期荣誉2022年度…

pyside6学习专栏(八):在PySide6中使用matplotlib库绘制三维图形

本代码原来是PySide6官网的一个示例程序,我对其进行的详细的注释,同时增加了一个功能:加载显示cass的地形图坐标数据示例,示例可显示以下几种三维图形 程序运行界面如下: 代码如下: # -*- coding: utf-8 -…

【多模态大模型论文精读】MOSHI:双工实时语音对话大模型

写在前面 大型语言模型(LLM)的飞速发展,让人机对话变得越来越自然流畅。从 Alexa、Siri 到 Google Assistant,语音助手已经成为我们生活中不可或缺的一部分。然而,这些看似智能的对话系统,背后却隐藏着一个…

Elasticsearch --- 相关基础知识整理

目录 1、核心功能2、主要用途3、数据模型4、优势5、映射5.1 映射的作用5.2 字段数据类型5.3 动态映射与显式映射5.4 映射设置5.5 多字段与元字段5.6 映射的创建与管理5.7 映射优化建议 6、 倒排索引6.1 **倒排索引的基本概念**6.2 **倒排索引的工作原理**6.3 **倒排索引的优势*…

lqb官方题单-速成刷题清单(上) - python版

预计3月5日 Wednesday 前完成 【2025年3月1日,记】题目太简单了,3月3日前完成 蓝桥杯速成刷题清单(上) https://www.lanqiao.cn/problems/1216/learning/?problem_list_id30&page1 替换题号1216 目录 进度题解和碎碎念1. 排…

计算机网络——详解TCP三握四挥

文章目录 前言一、三次握手1.1 三次握手流程1.2 tcp为什么需要三次握手建立连接? 二、四次挥手2.1 四次挥手流程2.2 为什么是四次,不是三次?2.3 为什么要等待2msl?2.4 TCP的保活计时器 前言 TCP和UDP是计算机网络结构中运输层的两…

【AD】3-6 层次原理图

自上而下 1.放置-页面符号,并设置属性 2.放置-端口 可通过如下设置将自动生成关掉 3.放置-添加图纸入口,并创建图纸 自下而上 1.子图的原理图页设计 设计资原理图,复制网络标签,智能粘贴未PORT 2.新建主图原理图 创建框…

C语言【指针篇】(四)

前言:正文1. 字符指针变量2. 数组指针变量2.1 数组指针变量是什么?2.2 数组指针变量怎么初始化 3. 二维数组传参的本质4. 函数指针变量4.1 函数指针变量的创建4.2 函数指针变量的使用4.3 两段有趣的代码4.3.1 typedef关键字 5. 函数指针数组6. 转移表 总结 前言&am…

认识苹果SWIFT语言

Swift 是苹果公司于 2014 年在 WWDC(苹果全球开发者大会)上发布的一种编程语言,旨在替代 Objective-C,用于开发 iOS、macOS、watchOS 和 tvOS 等苹果平台的应用程序。Swift 的设计目标是结合 C 和 Objective-C 的优点,…

python集合set的常用方法

目录 集合的定义 集合的基础操作 多个集合之间的操作 集合的for循环 集合的定义 集合的基础操作 集合.add(元素) 添加新元素 集合.pop() 从集合中随机取出一个元素 集合.clear() 清空集合 集合.remove(元素) 移除元素 #定义集合,集合自动去重了 set1{"春"…

2019年01月全国POI数据分享(同源历史POI分享系列)

2019年01月全国范围POI数据 2019年01月份全国范围历史POI数据,全国范围所有类别共59336781个POI 2019年01月全国范围POI数据按大类统计 大类代码大类名称2019年01月该类POI数量010000汽车服务1151164020000汽车销售213647030000汽车维修517367040000摩托车服务1800…

简单介绍JVM

1.什么是JVM? JVM就是Java虚拟机【Java Virtual Machine】,简称JVM。主要部分包括类加载子系统,运行时数据区,执行引擎,本地方法库等,接下来我们一一介绍 2.类加载子系统 JVM中运行的就是我们日常写的JA…