当前位置：网站首页>2.2 【pytorch】torchvision.transforms

2.2 【pytorch】torchvision.transforms

2022-07-01 09:03:00 【Enzo 想砸电脑】

这里写目录标题

关于 torchvision 和 transforms
transforms
reference：

关于 torchvision 和 transforms

（1）torchvision有四个功能模块：model、dataset、transforms、utils
（2）transforms 模块可对源数据进行预处理、增强
（3）transforms 提供了对PIL Image 对象和 Tensor 对象的常用操作。可通过PIL直接读取图片， PIL.Image.open(path) ;

官方文档地址： https://pytorch.org/vision/stable/transforms.html

transforms

1、裁剪（Crop）

中心裁剪：`transforms.CenterCrop`

torchvision.transforms.CenterCrop(size)

参数：
size: 所需裁剪的图片尺寸

from PIL import Image
import matplotlib.pyplot as plt
import torchvision.transforms as transforms

img_src = Image.open('./bird.jpg')

img_1 = transforms.CenterCrop(200)(img_src)
img_2 = transforms.CenterCrop((200, 200))(img_src)
img_3 = transforms.CenterCrop((300, 200))(img_src)
img_4 = transforms.CenterCrop((500, 500))(img_src)

plt.subplot(231)
plt.imshow(img_src)
plt.subplot(232)
plt.imshow(img_1)
plt.subplot(233)
plt.imshow(img_2)
plt.subplot(234)
plt.imshow(img_3)
plt.subplot(235)
plt.imshow(img_4)
plt.show()

在这里插入图片描述

以上例子我们可知：
（1）如果切正方形，transforms.CenterCrop(100) 和 transforms.CenterCrop((100, 100))，两种写size的方法，效果一样
（2）如果设置的输出的图片尺寸大于原尺寸，会在边上补黑色

随机裁剪：`transforms.RandomCrop`

# 依据给定的size随机裁剪
torchvision.transforms.RandomCrop(size, 
                      padding = None, 
                      pad_if_needed = False, 
                      fill=0, 
                      padding_mode ='constant')

功能：
从图片中随机裁剪出尺寸为 size 的图片，如果有 padding，那么先进行 padding，再随机裁剪 size 大小的图片。

参数：
size
padding: 设置填充大小
– – 当为 a 时，上下左右均填充 a 个像素
– – 当为 (a, b) 时，左右填充 a 个像素，上下填充 b 个像素
– – 当为 (a, b, c, d) 时，左上右下分别填充 a，b，c，d
pad_if_needed：当图片小于设置的 size，是否填
padding_mode：
– – constant: 像素值由 fill 设定（默认）
– – edge: 像素值由图像边缘像素设定
– – reflect: 镜像填充，最后一个像素不镜像。([1,2,3,4] -> [3,2,1,2,3,4,3,2])
– – symmetric: 镜像填充，最后一个像素也镜像。([1,2,3,4] -> [2,1,1,2,3,4,4,4,3])
fill：当 padding_mode 为 constant 时，设置填充的像素值（默认为0）

随机长宽比裁剪：transforms.RandomResizedCrop `

torchvision.transforms.RandomResizedCrop(size, 
                                         scale=(0.08, 1.0), 
                                         ratio=(0.75, 1.3333333333333333), 
                                         interpolation=2)

功能：
随机大小、随机宽高比裁剪图片。首先根据 scale 的比例裁剪原图，然后根据 ratio 的长宽比再裁剪，最后使用插值法把图片变换为 size 大小。

参数：
size: 裁剪的图片尺寸
scale: 随机缩放面积比例，默认随机选取 (0.08, 1) 之间的一个数
ratio: 随机长宽比，默认随机选取 ( $\displaystyle\frac{3}{4}$ , $\displaystyle\frac{4}{3}$ ) 之间的一个数。因为超过这个比例会有明显的失真
interpolation: 当裁剪出来的图片小于 size 时，就要使用插值方法 resize
– – PIL.Image.NEAREST
– – PIL.Image.BILINEAR
– – PIL.Image.BICUBIC

from PIL import Image
import matplotlib.pyplot as plt
import torchvision.transforms as transforms

img_src = Image.open('./bird.jpg')

img_6 = transforms.RandomResizedCrop((200, 300), scale=(1, 1))(img_src)
img_7 = transforms.RandomResizedCrop((200, 300), scale=(0.5, 0.5))(img_src)
img_8 = transforms.RandomResizedCrop((200, 300), scale=(1, 1),  ratio=(0.5, 0.5))(img_src)
img_9 = transforms.RandomResizedCrop((400, 600), scale=(1, 1),  ratio=(0.5, 0.5))(img_src)

plt.subplot(231)
plt.imshow(img_src)
plt.subplot(232)
plt.imshow(img_6)
plt.subplot(233)
plt.imshow(img_7)
plt.subplot(234)
plt.imshow(img_8)
plt.subplot(235)
plt.imshow(img_9)
plt.show()