文章目录
- 一、配置环境
- 1.1 Anaconda 下载安装
- 1.1.1 Anaconda 官网下载
- 1.1.2 清华镜像站下载
- 1.1.3 Anaconda 安装
- 1.2 配置虚拟环境
- 1.4 Paddlepaddle 安装(CPU版本)
- 1.5 PaddleOCR 下载
- 1.6 PPOCRLabel 安装
- 二、数据集制作
- 2.1 运行 PPOCRLabel
- 2.2 数据标注
- 三、打开 PPOCRLabel 时可能遇到的问题
- 3.1 AttributeError: "Namespace" object has no attribute "return_word_box"
- 3.2 ValueError: operands could not be broadcast together with shapes
一、配置环境
1.1 Anaconda 下载安装
【 两种下载方式,一种是去 Anaconda 官网下载,一种是去清华镜像站下载。二选一即可】
1.1.1 Anaconda 官网下载
Anaconda官网
访问上面官网链接,进入下面页面。
不想注册账号,点击 skip registration 即可,进入下面界面
点击,download,点击打开,等待下载完成即可
1.1.2 清华镜像站下载
清华镜像站
访问上面镜像站链接,进入下面页面。
点击 下箭头 ,最新的就在第一行了。
下载最新的就可以了【我下载的是 Anaconda3-2024.02-1-Windows-x86_64.exe
版本】
等待下载完成即可
1.1.3 Anaconda 安装
一直点击 next,I agree 等就可以了,唯一需要注意的是下面两个界面。
第一个是记得改路径,当然也可以不改,选择默认路径。【我是安装在D盘,默认是安装C盘】
第二个是,是否要自动添加环境变量和清理安装包。
【正常情况下是默认勾选1和3,我是已经安装过了,所以3没有勾选】
【2 是自动添加环境变量】
【4 是安装完后清理安装包】
【2 建议勾选,免得自己还要去配置环境变量,4 按需勾选即可】
后面等待安装完成即可,【安装过程有点慢,后面会卡在某一处很久,耐心等待即可】
1.2 配置虚拟环境
在开始菜单中最近添加可以找到 Anaconda Prompt,如果找不到,那就搜索。
找到后点击进入,输入命令 conda create -n paddle2 python=3.8
,
其中 paddle2 是虚拟环境名称,python=3.8 是 python 的版本是 3.8 。
【建议安装 3.8 ,安装其他版本可能会炸】
选择 y,等待下载完成即可
输入命令 activate paddle2
,激活创建的虚拟环境。【如果你前面创建的虚拟环境名称不是 paddle2,则修改为你自己命名的虚拟环境名称即可。】
1.4 Paddlepaddle 安装(CPU版本)
飞桨-源于产业实践的开源深度学习平台
访问上面链接,进入下面界面
选择对应参数,复制安装信息,在虚拟环境内输入,等待下载完成即可。
1.5 PaddleOCR 下载
在虚拟环境下。输入命令 pip install "paddleocr==2.7.0"
,等待 PaddleOCR 下载完成即可。
1.6 PPOCRLabel 安装
在虚拟环境下。输入命令 pip install PPOCRLabel
,等待 PPOCRLabel 下载完成即可。
二、数据集制作
2.1 运行 PPOCRLabel
在虚拟环境下,输入命令 PPOCRLabel --lang ch
即可运行。
2.2 数据标注
以标注 74HC595 的引脚为例
按住 w 键,把图中文字圈中,然后点击重新识别,右边就可以查看识别结果。
检查识别结果,对错误的结果进行修改,修改完成后保存,即完成了一份数据的制作。
三、打开 PPOCRLabel 时可能遇到的问题
3.1 AttributeError: “Namespace” object has no attribute “return_word_box”
进入 D:\anaconda3\envs\paddle2\Lib\site-packages\paddleocr\tools\infer
文件夹。【如果安装路径不在D盘,则把开头 D:\
修改为自己的安装路径】
打开 utility.py
文件,在 150 行附近找到下面代码块,在 return parser
代码之前添加下面这一行代码:
【不建议使用笔记本打开,笔记本没有行数标识,比较难找】
parser.add_argument("--return_word_box", type=str2bool, default=False, help='Whether return the bbox of each word (split by space) or chinese character. Only used in ppstructure for layout recovery')
【记得与上面语句列对齐,python 语句列对齐敏感】
3.2 ValueError: operands could not be broadcast together with shapes
进入 D:\anaconda3\envs\paddle2\Lib\site-packages\paddleocr
文件夹。【如果安装路径不在D盘,则把开头 D:\
修改为自己的安装路径】
打开 paddleocr.py
文件,在 512 行附近找到下面代码块,将下图圈中的变量替换为 cv2.IMREAD_COLOR
【不建议使用笔记本打开,笔记本没有行数标识,比较难找】