【图像分割】【深度学习】Windows10下UNet代码Pytorch实现与源码讲解
提示:最近开始在【医学图像分割】方面进行研究,记录相关知识点,分享学习中遇到的问题已经解决的方法。
文章目录
- 【图像分割】【深度学习】Windows10下UNet代码Pytorch实现与源码讲解
- 前言
- UNet模型运行环境搭建
- UNet模型运行
- 数据集与模型权重下载
- PFNet训练与测试
- 总结
前言
UNet是由德国弗赖堡大学的Olaf Ronneberger等人在《U-Net: Convolutional Networks for Biomedical Image Segmentation【MICCAI-2015】》【论文地址】一文中提出的U型编码和解码模型,即一个用于捕获上下文的收缩路径(编码器,下采样)和一个支持精确定位的对称扩展路径(解码器,上采样),并通过跳跃连接操作更好的融合浅层的位置信息和深层的语义信息。
在详细解析PFNet网络之前,首要任务是搭建UNet【Pytorch-demo地址】所需的运行环境,并完成模型训练和测试工作,展开后续工作才有意义。
UNet模型运行环境搭建
-
查看主机支持的cuda版本(最高)
# 打开cmd,执行下面的指令查看CUDA版本号 nvidia-smi
-
安装GPU版本的torch【官网】
博主的cuda版本是12.2,但这里cuda版本最高也是12.1,博主选的11.8也没问题。
其他cuda版本的torch在【以前版本】找对应的安装命令。 -
博主安装环境参考
# 创建虚拟环境 conda create -n UNet python=3.9 # 查看新环境是否安装成功 conda env list # 激活环境 activate UNet # 分别安装pytorch和torchvision pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 # 查看所有安装的包 pip list conda list
UNet模型运行
数据集与模型权重下载
名称 | 下载地址 | 说明 |
---|---|---|
DRIVE数据集 | 【官网】【百度网盘:8no8】 | 用于眼科图像处理研究的公共数据集,用于血管分割任务 |
模型权重 | 百度网盘: p50a | 使用U-Net在DRIVE数据集上训练得到的权重,仅供测试使用 |
将下载好的训练集解压并拷贝到当前工程目录下(建议)
将下载好的预训练权重(训练好的)best_model.pth拷贝到save_weights目录下(建议)。
PFNet训练与测试
-
训练:可以直接运行train.py,也可以根据硬件条件修改代码中部分训练参数epochs和batch-size修改训练次数和训练的batchsize等,详细的代码内容将在后续博文中介绍。
正在训练,训练权重保存在save_weights目录下:
-
测试:可以直接运行predict.py,也可以根据任务需求修改代码中部分变量img_path和roi_mask_path等,选择测试的图片。
对于DRIVE数据集img_path和roi_mask_path必须同时给定且一一对应,其他数据集以及个人数据集的训练和测试,博主会在后续的内容中给出修改后的代码。
测试结果保存为当前工程目录下的test_result.png,可以对比查看效果:
总结
尽可能简单、详细的介绍了UNet的安装流程以及UNet的使用方法。后续会根据自己学到的知识结合个人理解讲解UNet的原理和代码。