文章目录
- 深度生成模型之图像翻译GAN
- 图像翻译的应用
- 1. 风格迁移
- 2. 数据增强
- 3. 经典图像任务
- 4. 内容创作
- 5. 人脸图像编辑
- 6. 人体图像编辑
- 图像翻译模型
- 1. 有监督图像翻译模型
- 2. 无监督图像翻译模型
- 3. 多域图像翻译模型
深度生成模型之图像翻译GAN
图像翻译的应用
1. 风格迁移
- 各类风格化应用
2. 数据增强
- 仿真数据,增强数据的多样性
3. 经典图像任务
- 图像上色,图像分割,边缘检测,图像增强,超分辨,图像修复等
4. 内容创作
- 交互式图像生成,图像编辑
5. 人脸图像编辑
- 人脸表情,年龄,妆容,身份编辑,动漫风格化等
6. 人体图像编辑
- 虚拟试衣,动作迁移等
图像翻译模型
1. 有监督图像翻译模型
- Pix2pix,输入为图片,输出为图片,条件也是图片,需要成对的图片/标签数据进行训练
- Pix2pixHD,使用多尺度生成高精度结果(2048×1024)
2. 无监督图像翻译模型
- Couple-GAN,获取两个域的联合分布
- UNIT,使用两个编码器将不同域的样本X1和X2映射到共享潜在空间z,然后分别输入生成器和判别器
- CycleGAN,循环GAN
- CycleGAN工程技巧
- 与CycleGAN近似等价的其他结构,DualGAN,DiscoGAN,XGAN
3. 多域图像翻译模型
- StarGAN,多域之间的转换
- 部分内容来自阿里云天池