SVD压缩前后数据量减少的原因在于,通过奇异值分解(SVD),我们将原始数据(如图像)转换成了一种更加紧凑的表示形式。这种转换依赖于数据内部的结构和相关性,以及数据中信息的不均匀分布。
让我们简单分析一下这个过程为何能减少所需的数据量:
数据的结构和相关性
-
高度相关的数据:图像数据往往包含大量的空间相关性,即图像中相邻的像素点在颜色和亮度上通常非常接近。这种高度的相关性意味着原始图像可以通过更少的信息来近似表示,而不是独立地存储每一个像素的值。
-
信息的不均匀分布:在图像中,并不是所有像素都同等重要。某些区域(如图像中的边缘或纹理)包含了更多的视觉信息,而其他区域(如单一背景)的信息量较少。SVD正是利用了这种不均匀的信息分布,通过优先保留那些信息量大的成分,而忽略那些信息量小的成分,来实现数据压缩。
SVD压缩的工作原理
通过奇异值分解,图像被分解为三个矩阵((U), (\Sigma), (V^T)),其中包含了所有原始数据的信息。但是,我们可以选择只保留前(r)个最大的奇异值及其对应的向量,这样就能用较少的数据来近似原始图像。具体来说:
-
奇异值((\Sigma)):表示数据中的信息量,大的奇异值对应于数据中的主要特征。通过只保留前(r)个最大的奇异值,我们实际上保留了图像中的主要信息。
-
左奇异向量((U))和右奇异向量((V^T)):分别代表了图像行和列的基向量。保留前(r)个奇异值意味着我们只需要这些向量的一个子集。
为什么SVD比直接存储像素点节省空间?
直接使用像素点表示图像,我们需要为图像中的每个像素存储一个值(在灰度图像中)或三个值(在彩色图像中)。这种表示方法没有考虑像素之间的相关性和信息的重要性差异。
使用SVD后,我们仅通过三个矩阵((U_r), (\Sigma_r), (V_r^T))的乘积来近似表示原始图像。这三个矩阵的大小小于原始图像矩阵的大小,特别是当(r)远小于图像的原始维度时。因此,需要存储的数据量减少了,这就实现了数据压缩。
综上所述,虽然初始看起来每个像素直接存储似乎更简单、更直接,但通过利用图像数据的内在结构和信息分布的不均匀性,SVD提供了一种更为高效的数据表示方法。通过仅保留最重要的数据成分,它能够以更小的数据量来近似原始图像,从而达到数据压缩的目的。
MATLAB代码
clc;
clearvars;
close all;
% A_org=double(imread("lena.bmp"));
A_org=double(imread("lena256.bmp"));
[m_org,n_org]=size(A_org);
disp("原始图像像素个数:");
org_size=m_org*n_org;
disp(org_size);
compr=uint8(m_org*0.11);
[U_red ,S_red , V_red,A_red] = svd_compress( A_org, compr );
[m_U,n_U]=size(U_red);
U_size=m_U*n_U;
[m_S,n_S]=size(S_red);
S_size=m_S*n_S;
[m_V,n_V]=size(V_red);
V_size=m_V*n_V;
red_size=U_size+S_size+V_size;
disp("压缩后像素个数:");
disp(red_size);
disp("压缩比例:");
disp(red_size/org_size);
[m_red,n_red]=size(A_red);
disp("压缩后原始图像像素个数");
disp(m_red*n_red);
disp("PSNR:");
my_psnr=psnr(uint8(A_org),uint8(A_red));
disp(my_psnr);
function [ U_red ,S_red , V_red,A_red ] = svd_compress( A_org, compr )
% svd_compress compresses an input matrix (e.g. an image) using the
% Singular Value Decomposition (SVD).
% Input args: A_org: Any matrix with double real entries, e.g. an image
% file (converted from uint8 to double).
% compr: Quality of compression. If 0 <= compr < 1, it only keeps
% Singular Values (SVs) larger than compr times the biggest SV. If 1 <=
% compr <= number of SVs, it keeps the biggest compr SVs. Otherwise the
% function returns an error.
% Output args: A_red: Compressed version of A_org in double using the
% SVD, e.g. an image file (convert from double to uint8).
% SVD on the original matrix
[U,S,V] = svd(A_org);
% Extract Singular Values (SVs)
singvals = diag(S);
% Determine SVs to be saved
if compr >= 0 && compr < 1
% only SVs bigger than compr times biggest SV
indices = find(singvals >= compr * singvals(1));
elseif compr >= 1 && compr <= length(singvals)
% only the biggest compr SVs
indices = 1:compr;
else
% return error
error('Incorrect input arg: compr must satisfy 0 <= compr <= number of Singular Values');
end
% Truncate U,S,V
U_red = U(:,indices);
S_red = S(indices,indices);
V_red = V(:,indices);
% Calculate compressed matrix
A_red = U_red * S_red * V_red';
end
运行结果
SVD参考代码
https://github.com/matzewolf/Image_compression_SVD/blob/master/svd_compress.m