机器学习之SVD奇异值分解实现图片降维

SVD奇异值分解实现图片降维

目录

  • SVD奇异值分解实现图片降维
    • 1 SVD奇异值分解
      • 1.1 概念
      • 1.2 基本步骤
        • 1.2.1 矩阵分解
        • 1.2.2 选择奇异值
        • 1.2.3 重建矩阵
        • 1.2.4 降维结果
      • 1.3 优缺点
        • 1.3.1 优点
        • 1.3.2 缺点
    • 2 函数
      • 2.1 函数导入
      • 2.2 函数参数
      • 2.3 返回值
      • 2.4 通过 k 个奇异值降维
    • 3 实际测试
      • 3.1 原图数据
      • 3.2 代码测试

1 SVD奇异值分解

1.1 概念

SVD(奇异值分解)降维是一种常用的线性降维方法,在数据科学和机器学习中有着广泛的应用。SVD的主要思想是将一个矩阵分解为三个矩阵的乘积,通过保留最重要的奇异值和对应的奇异向量,来近似原矩阵,从而达到降维的目的。

1.2 基本步骤

1.2.1 矩阵分解

给定一个m * n 的数据矩阵A,SVD将其分解为三个矩阵的乘积:
A = U*Σ *V^T
其中:

  • U是一个m * n 的正交矩阵,其列向量称为左奇异向量。
  • Σ是一个m * n的对角矩阵,对角线上的非负数称为奇异值,按从大到小的顺序排列。
  • V^T是m * n的正交矩阵的转置,其行向量称为右奇异向量。
1.2.2 选择奇异值

奇异值在对角矩阵Σ中从大到小排列,前面的几个奇异值往往包含了矩阵中大部分的信息。通过选择前 k 个最大的奇异值( k 小于矩阵的秩),可以保留矩阵的主要特征

1.2.3 重建矩阵

选择前k个奇异值后,可以构造一个新的对角矩阵Σk,只包含这k 个最大的奇异值,其他位置为零。然后使用U 和V 的前k 个列向量来重建矩阵:
Ak = Uk*Σk *Vk^T
其中Uk和 Vk分别是由U和 V 的前k 个列向量组成的矩阵。

1.2.4 降维结果

矩阵 Ak 即为降维后的矩阵,其维度为 m * n 降低到了m * k 。通常情况下, k 远小于 n,因此达到了降维的效果。
在使用SVD降维时,选择合适的k 非常关键,这通常需要通过实验来确定,以便在降维和保留信息之间找到平衡。

1.3 优缺点

1.3.1 优点
  1. 信息保留能力:SVD能够有效地提取数据的主要特征,通过保留最大的奇异值,可以最大程度地保留原始数据的方差信息。
  2. 灵活性:SVD降维不依赖于数据的分布,对于多种类型的数据都适用,包括非负数据、稀疏数据等。
  3. 简化模型:通过减少特征的数量,SVD可以帮助简化机器学习模型,减少计算量,提高模型的泛化能力,减少过拟合的风险。
  4. 易于理解:SVD的数学原理相对直观,分解后的奇异值和奇异向量能够提供数据结构的直观解释。
  5. 稳定性:SVD是一种稳定的算法,对于小的数据扰动,其结果不会产生大的变化。
1.3.2 缺点
  1. 计算复杂度高:对于大型矩阵,SVD的计算复杂度较高,尤其是当矩阵的维度很高时,计算时间和空间复杂度都会显著增加。
  2. 不适合非线性数据:SVD是一种线性降维方法,对于非线性结构的数据,其降维效果可能不如非线性降维方法(如t-SNE、Isomap等)。
  3. 对噪声敏感:虽然SVD相对稳定,但在某些情况下,小的奇异值可能反映了噪声或异常值,这可能导致降维过程中噪声被放大。
  4. 数据量要求:SVD需要将整个数据集加载到内存中进行处理,对于非常大的数据集,这可能是一个挑战。
  5. 特征解释性:虽然SVD可以提供数据结构的解释,但分解后的特征可能不如原始特征直观,这可能会降低模型的可解释性。
  6. 需要选择奇异值数量:在使用SVD降维时,需要手动或通过交叉验证等方法选择保留的奇异值数量(即降维后的维度),这个选择过程可能需要多次尝试,并且可能对最终结果有较大影响。
    总的来说,SVD降维是一个强大的工具,特别适用于需要保留数据主要方差特征的场景。然而,它的应用也受到一些限制,特别是当处理大规模数据集或非线性结构的数据时。

2 函数


2.1 函数导入

from numpy.linalg import svd

2.2 函数参数

  • 默认值:a, full_matrices=True, compute_uv=True, hermitian=False,一般输入a参数,其他默认
  1. a一个形状为(M, N)的数组,需要被分解的矩阵
  2. full_matrices:布尔值,可选,默认为True。
    • 如果为True,则U和V*的形状分别是(M, M)和(N, N),奇异值将被填充为一个(M, N)的对角矩阵。
    • 如果为False,则U和V*的形状分别是(M, K)和(K, N),其中K = min(M, N),奇异值仍然是一个(K, )的数组。
  3. compute_uv:布尔值,可选,默认为True。
    • 如果为True,则计算U和V*。
    • 如果为False,则只计算奇异值,不计算U和V*。
  4. hermitian:布尔值,可选,默认为False。
    • 这个参数在NumPy的较新版本中已经废弃,不再推荐使用。它用于指定矩阵是否为厄米特矩阵(即共轭转置等于自身的矩阵)。如果为True,则函数计算的是矩阵的 eigendecomposition 而非 SVD。

2.3 返回值

该函数返回三个数组:

  1. U:形状为(M, M)或(M, K)的数组,取决于full_matrices参数,包含了左奇异向量。
  2. s:形状为(K, )的数组,包含了矩阵的奇异值,奇异值是按降序排列的
  3. Vh:形状为(N, N)或(K, N)的数组,取决于full_matrices参数,包含了右奇异向量的共轭转置。

2.4 通过 k 个奇异值降维

代码展示:

def pic_compress(k,pic_array):
    global u,sigma,vt,sig,new_pic
	# pic_array为数组
	u,sigma,vt = svd(pic_array)
    # 创建一个对角矩阵,对角线上的元素是前k个奇异值
    sig = np.eye(k) * sigma[:k]
    # 通过奇异值分解重构图像,只使用前k个奇异值
    new_pic = np.dot(np.dot(u[:,:k],sig),vt[:k,:])
    # 计算压缩后图像的大小
    size = u.shape[0] * k + sig.shape[0] * sig.shape[1] + k * vt.shape[1]
    # 返回重构后的图像和其大小
    return new_pic,size

3 实际测试


3.1 原图数据

在这里插入图片描述

3.2 代码测试

代码展示:

from PIL import Image
import numpy as np
import matplotlib.pyplot as plt
from numpy.linalg import svd

def pic_compress(k,pic_array):
    global u,sigma,vt,sig,new_pic

    u,sigma,vt = svd(pic_array)
    # 创建一个对角矩阵,对角线上的元素是前k个奇异值
    sig = np.eye(k) * sigma[:k]
    # 通过奇异值分解重构图像,只使用前k个奇异值
    new_pic = np.dot(np.dot(u[:,:k],sig),vt[:k,:])
    # 计算压缩后图像的大小
    size = u.shape[0] * k + sig.shape[0] * sig.shape[1] + k * vt.shape[1]
    # 返回重构后的图像和其大小
    return new_pic,size

img = Image.open('at1_gry.png')
ori_img = np.array(img)
new_img,size = pic_compress(50,ori_img)
print(f'original size:{ori_img.shape[0]*ori_img.shape[1]}')
print(f'compress size:{size}')
# 创建一个包含两个子图的图形
fig,ax = plt.subplots(1,2)
# 在第一个子图中显示原始图像
ax[0].imshow(ori_img,cmap='gray')
# 设置第一个子图的标题为before compress
ax[0].set_title('before compress')
ax[1].imshow(ori_img,cmap='gray')
ax[1].set_title('after compress')
plt.show()

运行结果:

可以看到降维后图片比降维前模糊

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/955608.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Linux《Linux简介与环境的搭建》

在学习了C或者是C语言的基础知识之后就可以开始Linux的学习了,现在Linux无论是在服务器领域还是在桌面领域都被广泛的使用,所以Linxu也是我们学习编程的重要环节,在此接下来我们将会花大量的时间在Linxu的学习上。在学习Linux初期你可以会像初…

二进制/源码编译安装mysql 8.0

二进制方式: 1.下载或上传安装包至设备: 2.创建组与用户: [rootopenEuler-1 ~]# groupadd mysql [rootopenEuler-1 ~]# useradd -r -g mysql -s /bin/false mysql 3.解压安装包: tar xf mysql-8.0.36-linux-glibc2.12-x86_64.ta…

boss直聘 __zp_stoken__ 逆向分析

声明: 本文章中所有内容仅供学习交流使用,不用于其他任何目的,抓包内容、敏感网址、数据接口等均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关! 有相关问题请第一时间头像私信联系我删…

pyspark连接clickhouse数据库的方式(其它数据库同样适用)

目录 一、背景简记二、pyspark连接clickhouse方式记录三、结语参考学习博文 一、背景简记 实际工作中,大部分所用的数据存储地址都是在数据库中,如我司现在常用的数据库是clickhouse,相关数据的统计分析都在此上操作。如果想用pyspark连接cl…

【JSqlParser】Java使用JSqlParser解析SQL语句总结

简述 Java解析SQL语句有很多工具都可以做到,比如Mybatis、Druid、目前用来用去最全面的仍然是Jsqlparser,它是一个Github上的开源项目,JSqlParser是一个用于解析SQL语句的Java库,它可以帮助开发者分析和操作SQL语句的结构。无论是…

Ubuntu本地部署网站

目录 1.介绍 2.安装apache 3.网页升级 1.介绍 网站其实就相当于一个文件夹,用域名访问一个网页,就相当于访问了一台电脑的某一个文件夹,在网页中看见的视频,视频和音乐其实就是文件夹里面的文件。为什么网页看起来不像电脑文件夹…

C++异常处理详解

概述 这篇博客将深入探讨 C异常处理的工作原理, 最佳实践以及如何编写异常安全的代码, 配有代码示例和详细说明. 1. 异常的挑战 性能开销: 异常在失败情况下会带来显著的运行时成本. 图片来自: Introduction to proposed std::expected - Niall Douglas - Meeting C 2017 推…

零基础构建最简单的 Tauri2.0 桌面项目 Star 88.4k!!!

目录 预安装环境 安装nodejs windows下安装 linux下安装 nodejs常遇问题 安装C环境 介绍 下载 安装 安装Rust语言 Tauri官网 安装 vscode 安装 rust 插件 安装 Tauri 插件 运行成果 预安装环境 安装nodejs windows下安装 NodeJs_安装及下载_哔哩哔哩_bilibi…

Python基于Django的图像去雾算法研究和系统实现(附源码,文档说明)

博主介绍:✌IT徐师兄、7年大厂程序员经历。全网粉丝15W、csdn博客专家、掘金/华为云//InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专栏推荐订阅👇&#x1f3…

【AI插件】在VS Code中免费使用GitHub Copilot

什么是GitHub Copilot GitHub Copilot 是由 GitHub 和 OpenAI 合作开发的一款 AI 编程助手,旨在帮助开发者提高编程效率。它通过分析大量的开源代码,生成上下文相关的代码建议和自动补全,支持多种编程语言和框架。GitHub Copilot 是基于 Ope…

map和set c++

关联式容器也是⽤来存储数据的,与序列式容器不同的是,关联式容器逻辑结构通常是⾮线性结构,两个位置有紧密的关联关系,交换⼀下,他的存储结构就被破坏了。顺序容器中的元素是按关键字来保存和访问的。关联式容器有map/…

2025年01月蓝桥杯Scratch1月stema选拔赛真题—美丽的图形

美丽的图形 编程实现美丽的图形具体要求: 1)点击绿旗,角色在舞台中心,如图所示; 2)1秒后,绘制一个边长为 140的红色大正方形,线条粗细为 3,正方形的中心为舞台中心,如图所示; 完整题目可点击下…

hive连接mysql报错:Unknown version specified for initialization: 3.1.0

分享下一些报错的可能原因吧 1.要开启hadoop 命令&#xff1a;start-all.sh 2.检查 hive-site.xml 和 hive-env.sh。 hive-site.xml中应设置自己mysql的用户名和密码 我的hive-site.xml如下&#xff1a; <configuration><property><name>javax.jdo.opt…

AI编程工具使用技巧——通义灵码

活动介绍通义灵码1. 理解通义灵码的基本概念示例代码生成 2. 使用明确的描述示例代码生成 3. 巧妙使用注释示例代码生成 4. 注意迭代与反馈原始代码反馈后生成优化代码 5. 结合生成的代码进行调试示例测试代码 其他功能定期优化生成的代码合作与分享结合其他工具 总结 活动介绍…

Python编程与在线医疗平台数据挖掘与数据应用交互性研究

一、引言 1.1 研究背景与意义 在互联网技术飞速发展的当下,在线医疗平台如雨后春笋般涌现,为人们的就医方式带来了重大变革。这些平台打破了传统医疗服务在时间和空间上的限制,使患者能够更加便捷地获取医疗资源。据相关报告显示,中国基于互联网的医疗保健行业已进入新的…

大文件上传服务-后端V1V2

文章目录 大文件上传概述:minio分布式文件存储使用的一些技术校验MD5的逻辑 uploadV1 版本 1uploadv2 版本 2 大文件上传概述: 之前项目做了一个文件上传的功能,最近看到有面试会具体的问这个上传功能的细节&#xff0c;把之前做的项目拿过来总结一下&#xff0c;自己写的一个…

[BrainShadow-V1] VR头戴设备统计报告

Brain-Shadow-V1 EventVR headsetsReported byXiao enDate2025/01/15Version1.0 HTC Vive Pro 2 Pro HTC Vive Pro 2 是一款高端虚拟现实头显&#xff0c;配备双 2.5K 显示屏&#xff0c;组合分辨率达到 48962448&#xff0c;提供 120 的视场角和 120Hz 的刷新率。该设备支持…

路由环路的产生原因与解决方法(1)

路由环路 路由环路就是数据包不断在这个网络传输&#xff0c;始终到达不了目的地&#xff0c;导致掉线或者网络瘫痪。 TTL &#xff08;生存时间&#xff09;&#xff1a;数据包每经过一个路由器的转发&#xff0c;其数值减1&#xff0c;当一个数据包的TTL值为0是&#xff0c;路…

工业网口相机:如何通过调整网口参数设置,优化图像传输和网络性能,达到最大帧率

项目场景 工业相机是常用与工业视觉领域的常用专业视觉核心部件&#xff0c;拥有多种属性&#xff0c;是机器视觉系统中的核心部件&#xff0c;具有不可替代的重要功能。 工业相机已经被广泛应用于工业生产线在线检测、智能交通,机器视觉,科研,军事科学,航天航空等众多领域 …

企业邮箱iRedMail搭建

用自己的域名作为邮箱的后缀&#xff0c;好看、有面子&#xff01;只要域名不过期&#xff0c;那么&#xff0c;你的邮箱就永远存在&#xff01; 邮件系统很多&#xff0c;宝塔自带的邮局更是简单&#xff0c;但是若想邮箱可靠&#xff08;丢邮件、发送邮件进入对方垃圾箱等&a…