【2024MathorCup妈妈杯建模】赛题 B:甲骨文智能识别中原始拓片单字自动分割与识别研究
加群可以享受定制等更多服务,或者搜索B站:数模洛凌寺
联络组织企鹅:904117571
问题重述
问题 1:对于附件 1(Pre_test 文件夹) 给定的三张甲骨文原始拓片图 片进行图像预处理,提取图像特征,建立甲骨文图像预处理模型,实现对甲骨文图像干扰元素的初步判别和处理。
问题 2:对甲骨文原始拓片图像进行分析,建立一个快速准确的甲骨 文图像分割模型,实现对不同的甲骨文原始拓片图像进行自动单字分割, 并从不同维度进行模型评估。其中附件 2(Train 文件夹) 为已标注分割的数据集。
问题 3:利用建立的甲骨文图像分割模型对附件 3(Test 文件夹) 中的 200 张甲骨文 原始拓片图像进行自动单字分割, 并将分割结果放在“Test_results.xlsx ”中,此文件单独上传至竞赛平台。
问题 4:基于前三问对甲骨文原始拓片图像的单字分割研究, 请采用 合适的方法进行甲骨文原始拓片的文字识别,附件 4(Recognize 文件夹) 中给出了部分已标注的甲骨文字形(不限于此训练集,可自行查找其他资 料,如使用外部资料需在论文中注明来源),请对测试集中的 50 张甲骨文原始拓片图像进行文字自动识别, 并以适当结果呈现。
问题分析
问题一:
考察图像的预处理,这里题目有很多的方法,我们先过了,等全部模型搭建好了,再进行降噪等处理,看看对比的效果,先硬train一发
问题二:
这个题考察的是图像分割,也就是用赛题给的“训练数据”训练一个【分割模型】,然后用这个模型在测试数据上进行实验,把测试数据中的文字的位置表示出来
问题三:
这个是问题二的实验部分
问题四:
这个题可以看做一个多分类问题(文字识别),可以参考手写数据集分类(10类),只是我们这个类别比较多而已。
详细讲解
可以关注B站:数模洛凌寺
沟通交流答疑:
i = 1
if i == 1 :
print('904117571')