1 图像类型
有多种库可加载图像,如imageio, torchvision等。张量对图像维度排序一般为通道数x图像长x图像宽
1.1 imageio
import imageio
img_t = imageio.imread(img_path)
1.2 改变布局
可对tensor调用permute方法改变张量某个维度元素排序
和转置类似但不同,转置直接逆序,permute可以自定义顺序
permute和transpose一样,使用相同存储区,所以速度快
1.3 加载并填充图像
先预加载目标大小的tensor,再将图像读入tensor,开销少
1.4 数据标准化
神经网络对参数敏感,参数为0-1或-1~1时效果最好,一种常用方法是先转为float类型,再除255,应该也有现成的方法直接弄好
注意,标准化平均值和标准差要在最小维度,不要包含多个维度,否则放缩不到0~1或-1~1