尺寸调整前 | 尺寸调整前 |
1、背景介绍
在深度学习中,将图像调整到固定尺寸(如28x28像素)的操作是非常常见的,尤其是在处理诸如图像分类、物体检测和图像分割等任务时。这种操作有几个重要原因:
-
标准化输入:许多深度学习模型都是为特定输入尺寸设计的。将所有图像调整到相同的尺寸可以确保每个输入都被以相同的方式处理,这有助于模型的训练和预测。
-
批量处理:在深度学习中,通常会使用批处理技术来同时处理多个输入。固定尺寸的图像可以更容易地与批量大小对齐,从而提高计算效率。
-
网络架构的假设:一些网络架构(如LeNet、AlexNet等)假设输入图像具有特定的尺寸。如果输入图像的大小不一致,网络可能无法正确地处理它们。
-
计算效率:固定尺寸的图像可以简化模型的设计,使得网络层(如卷积层和池化层)的参数数量减少,从而提高计算效率。
-
数据增强:在训练过程中,可以对调整后的图像应用数据增强技术,如随机裁剪、旋转、缩放等,以增加训练数据的多样性,从而提高模型的泛化能力。
-
输入层的大小:大多数深度学习框架(如TensorFlow和PyTorch)的输入层(如
tf.placeholder
或torch.autograd.Variable
)需要知道输入数据的尺寸。固定尺寸的图像可以确保输入层正确地设置其形状。
如下图所示,人工制作的一张图片,像素为71*70,与常用模型固定尺寸存在差异,如28*28,需要处理,要达到如下效果。
71*70 | 28*28 |
2、图像尺寸调整
本次介绍2种场景下图像尺寸调整,分别为单张图片调整、批量图像尺寸调整。
2.1 单张图像尺寸调整
单张图像调整,即只对一张图像尺寸调整,代码如下。如下所示,将0.jpg的图片,调整为大小为28*28的图像,使用函数resize()函数。
from PIL import Image
#单独图片进行裁切处理
# 读取图片
image_path = '0.jpg' # 替换为你的图片路径
image = Image.open(image_path)
# 调整图片大小为28x28像素
resized_image = image.resize((28, 28), Image.BICUBIC)
# 保存或显示调整大小的图片
resized_image.save('0_resize.jpg')
resized_image.show()
效果如下图所示,左边为原始图像,经过调整后,图像尺寸变为28*28,变小了。因此,右边图像明显小于左边。
2.2 批量图像尺寸调整
实际中,图像在处理前需要统一尺寸大小,方便后续图像处理。因此,存在一个批量处理过程。其对多张图像进行统一处理。如下代码,为对10张图片,统一调整为尺寸大小为28*28的图像,其中处理前图像命名按照1.jpg、2.jpg、3.jpg、......进行命名。如下图所示,其实可以发现,0-9这10张图片,尺寸大小是不一样的。
如下代码中,文件路径infile采用了for循环语句进行给定,其中{}可以看成数字i。在最后保存时,以同样方式进行保存调整尺寸后的图片。
#批量进行裁切
from PIL import Image
for i in range(10):
infile = 'D:/test/' + '{}.jpg'.format(i)
image = Image.open(infile)
# 调整图片大小为28x28像素
resized_image = image.resize((28, 28), Image.BICUBIC)
#颜色进行反转
savefile='D:/test/' +'{}'.format(i)+'_resize.jpg'
resized_image.save(savefile)
如下图所示,排在前面的为调整尺寸后图像,可以发现其尺寸大小基本一致,表明程序运行成功。其实,从图像详细信息中,可以查看像素值,如下图所示。
调整前像素97*103 | 调整后像素28*28 |
3、总结
本次介绍了基于python中Image库,实现对图像大小调整,其中包含单张图像与批量图像大小调整。