有关于无人机目标检测和红外场景下的目标检测的项目在我之前的文章中都有实践经历了,但是将无人机和红外场景结合的目标检测项目还是很少的,本文的核心想法就是基于高空无人机场景开发构建目标检测系统。
前面相关博文如下,感兴趣的话可以自行移步阅读:
《UAV 无人机检测实践分析》
《基于目标检测的无人机航拍场景下小目标检测实践》
《基于DeepLabV3Plus实现无人机航拍目标分割识别系统》
《基于YOLO开发构建红外场景下无人机航拍车辆实例分割检测识别分析系统》
《基于目标检测实现遥感场景下的车辆检测计数》
《共建共创共享》
首先看下效果图:
接下来看下数据集情况,如下所示:
VOC格式数据标注文件如下所示:
实例标注内容如下:
<annotation>
<folder>DATASET</folder>
<filename>images/0a8d3926-2beb-4d2c-9d58-86ea70fe3b58.jpg</filename>
<source>
<database>The DATASET Database</database>
<annotation>DATASET</annotation>
<image>DATASET</image>
</source>
<owner>
<name>YMGZS</name>
</owner>
<size>
<width>640</width>
<height>512</height>
<depth>3</depth>
</size>
<segmented>0</segmented>
<object>
<name>Car</name>
<pose>Unspecified</pose>
<truncated>0</truncated>
<difficult>0</difficult>
<bndbox>
<xmin>317</xmin>
<ymin>236</ymin>
<xmax>377</xmax>
<ymax>284</ymax>
</bndbox>
</object>
</annotation>
YOLO格式标注文件如下所示:
实例标注内容如下所示:
1 0.525 0.646484375 0.040625 0.08203125
1 0.6640625 0.654296875 0.040625 0.08203125
1 0.19765625 0.75390625 0.0484375 0.1015625
1 0.48203125 0.39453125 0.0359375 0.07421875
1 0.59453125 0.39453125 0.0328125 0.0625
1 0.7671875 0.453125 0.03125 0.05078125
1 0.684375 0.451171875 0.03125 0.05078125
1 0.725 0.3955078125 0.034375 0.048828125
1 0.6578125 0.4013671875 0.028125 0.044921875
1 0.77421875 0.3896484375 0.0390625 0.060546875
1 0.9359375 0.59375 0.046875 0.078125
1 0.840625 0.3984375 0.0375 0.06640625
1 0.96640625 0.3935546875 0.0328125 0.060546875
2 0.4296875 0.244140625 0.025 0.04296875
2 0.43828125 0.26953125 0.0203125 0.0390625
2 0.43984375 0.2373046875 0.0171875 0.029296875
2 0.45234375 0.263671875 0.0140625 0.03125
2 0.453125 0.2255859375 0.0125 0.025390625
2 0.46953125 0.2470703125 0.0234375 0.041015625
2 0.50234375 0.251953125 0.0234375 0.0390625
2 0.5171875 0.2490234375 0.021875 0.041015625
2 0.69296875 0.263671875 0.0265625 0.03515625
2 0.71796875 0.263671875 0.0171875 0.03125
2 0.7796875 0.21484375 0.0125 0.03515625
2 0.79140625 0.2119140625 0.0203125 0.037109375
2 0.809375 0.2265625 0.015625 0.05078125
2 0.8265625 0.21875 0.015625 0.04296875
2 0.840625 0.220703125 0.015625 0.04296875
2 0.8578125 0.2666015625 0.025 0.041015625
2 0.84296875 0.2685546875 0.0140625 0.033203125
2 0.8296875 0.2626953125 0.0125 0.029296875
2 0.828125 0.291015625 0.021875 0.03125
默认设置100次的迭代计算,看下n/s/m三款模型对应的结果,如下所示:
【n】
【s】
【m】
batch计算实例如下:
为了直观对比三款模型的性能,这里对其进行整体对比可视化,如下所示:
【F1值曲线】
【loss曲线可视化】
【Precision曲线】
【Recall曲线】
整体来看:m模型效果是最优的,不过参数量相较于n和s也是最大的,实际使用可以根据自己的需要选择合适的模型即可。