案例1
OCR文字识别流水线主要分为三个模块:文字检测->字符分割->字符识别
训练完成后整个系统的准确率是72%,需要进一步提升准确率就需要单独分析每个模块的提升空间。
1)对于文件检测模块,把训练集的图像人工确保标注准确的文本位置来作为输入,系统准确率提升到89%
2)对于字符分割模块,用人工准确标注的文本位置作为输入来代替文件检测模块的输出结果,系统准确率提升到90%
3)对于字符识别模块,用人工准确的分割数据作为输入来代替字符分割模块的输入结果,系统准确率提升到100%
根据准确率的提升幅度来看,文件检测模块和字符识别模块还有很大的提升空间,需要投入更多的精力优化这两个模块。
案例2
人物识别流水线:图像预处理->人脸检测->眼睛分割->鼻子分割->嘴巴分割->逻辑回归分类
训练完成后整个系统的准确率是85%,需要进一步提升准确率就需要单独分析每个模块的提升空间。
1)对于图像预处理模块,需要根据图像把人物和背景分开,用人工标注的方式来准确区分背景作为输入,系统准确率提升到85.1%
2)对于人脸检测模块,需要根据图像框选出人脸位置,用人工去除背景的图像作为输入代替图像预处理模块的输出结果,系统准确率提升到91%
3)对于眼睛分割模块,从人脸中框选出眼睛位置,用人工准确标注眼睛位置作为输入代替人脸检测模块的输出结果,系统准确率提升到95%
以此类推.........
根据准确率的提升幅度来看,人脸检测模块、眼睛分割和逻辑回归分类模块有较大的提升空间,需要投入更多的精力优化这几个模块。