本想大迈步进入前馈神经网络
但是…唉…瞅了几眼,头晕
然后想到之前梳理的奇异值分解、主成分分析、CBOW都没有实战
如果没有实际操作,会有一种浮在云端的虚无感
但是如果要实际操作,我又不想直接调用库包
可是…如果不直接调包,感觉自己又像是在造轮子造螺丝,明明别人都已经造好了,为什么还要自己造一遍呢
意义何在?
这又让我回想当初开始机器学习的初衷:消磨时间
既然初衷至今没变,那就不应该求快,应该尽可能合格专业地磨洋工
生活本就没有意义,再加快脚步,又有什么意义呢?
slow down
好叭,那就慢慢来,自己造个破破烂烂的轮子,也能敝帚自珍
通过奇异值分解,来压缩图片
这就需要opencv来获取图片的RGB信息。
import cv2
img = cv2.imread("crab.png", 1)
print(img)
首先,获取到的图片信息是个嵌套数组,一般每个像素表示一个向量,这个向量里含有RGB三个数值
获取到的颜色信息数据,是个嵌套数组,并不是奇异值分解中的标准矩阵形式
因此,我们需要将RGB这三个颜色通道的数据拆分开,变成三个矩阵
- 矩阵1:表示红色通道的图片信息
- 矩阵2:表示绿色通道的图片信息
- 矩阵3:表示蓝色通道的图片信息
b,g,r = cv2.split(img)
算了,还是直接给出完整代码吧
import cv2
import numpy as np
# 前k个sigma
k = 1000
# 读取三通道颜色
img = cv2.imread("img1.png", 1)
colors = cv2.split(img)
new_colors = []
for c in colors:
# 奇异值分解
u, sigma, v = np.linalg.svd(c, full_matrices=0)
u = u[:,:k] # 获取U的前k列
sigma = np.diag(sigma[:k]) # 奇异值是一个一维向量,将奇异值构造成对角矩阵
v = v[:k,:] # 获取V的前k行
# 组建压缩后的新矩阵
a = np.matmul(u,sigma)
new_c = np.matmul(a,v)
"""转型!!!很重要!!!!因为矩阵计算后是float型,float型在cv2的显示有很大问题!!!!!!!!!!"""
new_c = new_c.astype('uint8')
new_colors.append(new_c)
# 展示原图与压缩图片
cv2.imshow("img-old", cv2.merge(colors))
cv2.imshow("img-new", cv2.merge(new_colors))
cv2.waitKey(0)
这是k=1000时的对比
这是k=100时的样子
K的取值范围,是基于sigma奇异值的个数范围内
因此,有些人为了避免自己k值设置超出范围报错,可以加以限制
但我被下边的bug烦了4个小时,有些气恼,懒得搞了
找了4个小时的bug!!!!!!居然是没有将float转为整数!!!含恨吐血
new_c = new_c.astype('uint8')
没有转型,就会变成下边这样,。,。。。。鬼样!!