• 工作总结
  • 工作计划
  • 心得体会
  • 领导讲话
  • 发言稿
  • 演讲稿
  • 述职报告
  • 入党申请
  • 党建材料
  • 党课下载
  • 脱贫攻坚
  • 对照材料
  • 主题教育
  • 事迹材料
  • 谈话记录
  • 扫黑除恶
  • 实施方案
  • 自查整改
  • 调查报告
  • 公文范文
  • 思想汇报
  • 当前位置: 雅意学习网 > 文档大全 > 公文范文 > 正文

    基于YOLOv3模型的牦牛目标检测

    时间:2023-06-03 09:20:23 来源:雅意学习网 本文已影响 雅意学习网手机站

    达措 李蕾

    (西藏大学信息科学技术学院 西藏 拉萨 850000)

    随着科学技术的发展西藏各地区的生活水平和医疗等各方面得到了很大的改善,但西藏的畜牧业产业还依然存在着很多困难,没有做到全面的智能化到目前大部分工作仍然需要依靠人工来实施。西藏那曲是西藏畜牧业大区,大部分以放牧为生因受自然条件恶劣,高海拔等因素以及牦牛特有的抗寒和生存能力强的特点,牦牛是牧区的主要牲畜。然而在牧区存在牲畜的种类和数量多原因,在进行家畜的辨别或计数时存在误认、数错、耗费时间长以及需要较多的人手等各种问题。目前基于深度学习的目标检测主流框架可以分为两类:一类是基于two-stage的方法,比如RCNN,Fast RCNN,Faster RCNN。另一类是one-stage的目标检测框架,例如YOLO系列和SSD等。本文用darknet-53为框架的YOLOv3模型作为牦牛目标检测的模型,将牦牛和其他牛类以及牧区的其他牲畜区分开来,从而达到只检测牦牛的效果[1]。

    1.1 深度学习

    深度学习(Deep Learning)是一种表示学习方法,它具有强大的数据表征能力[2]。更通俗地理解深度学习是学习样本数据中的特征以及数据的内在规律来从未知到已知去探索和思考以及推理、计算的一个过程。它是起源于人工智能和机器学习,深度学习在发展期间曾经历过两次低谷时期分别是:(1969-1986,1998-2006)。Hinton等[3]在2006年提出了以深度信念网络为代表的深度学习方法,深度学习迅速发展了起来,并且在图像分类和语音识别上有了重大突破[4-5]深度学习的神经网络是模拟人类的大脑机制而成它是模仿人的视觉和思考能力来解释大量的数据和图像进行识别和分类。神经网络需要大量的数据进行训练,才能具有基本的技能。

    将输入到网络的图像划分为S×S的网格。基本过程如图1所示。

    YOLOv3算法是2018年Redmon等人在YOLOv2保留了原有的算法基础上提出,它使用了全卷积网络并且网络结构中无全连接层和池化层。是当下主流的一种快速目标检测算法。主要引入了多尺度特征融合,通常输入YOLOv3网络的图像大小为416×416最后输出的特征图有13×13、26×26、52×52的三个不同尺度的输出。并且在COCO数据集上已经能检测出80种类。

    3.1 数据采集和分组情况

    由于设备的欠缺此次实验用的数据拍摄工具为Android手机,采集图片的存储格式为jpg格式。采集的数据将分成三种部分A组数据是牦牛在牛圈里时进行的拍摄,背景较为统一且拍摄距离近更有利用个体识别1807幅图。B组是牦牛在山上或草原上时进行的拍摄,有远近距离和拍摄背景不同的影响,同时也受到牛群密集而造成的遮挡现象,共有1466幅图。C组是在一张图像中有牦牛与其他牦牛一起的数据,因那曲地区班戈县没有犏牛和黄牛及其他牛类的原因,C组的数据是通过网上爬虫的方法获取,再次经过人工筛选和处理将牦牛与其他牛类放在一起作为干扰数据,共有118幅图。

    3.2 实验设备

    实验设备配置为ubuntu18.04操作系统,显卡为NVIDIA GeForce RTX 3070,深度学习框架为darknet-53,CPU为Inteli7-10700。

    3.3 训练自己的数据集

    3.3.1 数据标注软件

    使用精灵标注软件对数据进行标注,它是一款有多种数据导出的输出方式有的数据标注软件,支持XML、JSON、MongoDB、pascal-voc格式的输出。本文使用的输出方式为XML。

    3.3.2 数据的划分

    将数据份为训练集和测试集,A组训练集共有1195幅图,测试集共有612幅图。B组训练集共有975幅图,测试集共有491幅图。A+B+C组训练集共有2578幅图,测试集共有813幅图。

    3.3.3 评价指标

    目标检测常用的评价指标有各类平均精确率M A P(m e a n average precision)、类内平均精确率AP (average precision)、精确率P (precision)、召回率R(recall)等。本文章计算P、R、MAP值对模型进行评估,其各指标的计算公式如下:

    其中精确率P是针对于预测数据的准确结果而言的,它是表示在数据集中预测为正例的样本有多少是真正的正样本。它有两种不同的情况:TP(true positives)是正类预测结果也是正类,即真正类。

    FP(false positives)是负类预测结果为正类,即假正类是误报结果。召回率R是针对数据的原样本结果而言,它是表示在原样本中的正例有多少是被预测正确的。也同样有两种情况:TP(true positives)是表示原样本为正类预测结果也是正类,即真正类。FN(false negatives)是表示原样本为正类而预测结果是负类,即假负类是漏报结果。

    MAP是PR曲线的定积分,面积取值范围内面积越大说明算法准确度越高。

    4.1 对不同数据集上的检测效果对比

    使用不同数据集训练网络将MAP(mean average precision)值进行对比,如表1所示,结果显示A组测试效果为最差不能很好地检测出远距离的牦牛而且不能将牦牛与其他牛类区分。B组虽然可以很好地检测出远距离牦牛以及背景复杂的牦牛,但仍不能区分牦牛与其他牛类。A+B+C组检测效果最佳,且能很好地区分牦牛与黄牛、水牛、奶牛等但由于犏牛的特征与牦牛极为相似模型还不能完全的将牦牛与犏牛区分开来。此实验说明训练数据不能太过于统一化模型需要加入干扰数据更有利用应用在真实场景中。

    表1 不同数据集上的MAP值

    4.2 目标检测实验结果

    图2为A组图像是牦牛在牛圈场景下拍的示例图检测效果,图3为B组图像是在山上远距离拍的示例图检测效果,图4为C组图像是将牦牛与其他牛类和牲畜的示例图检测效果,图5是为了验证牦牛检测效果的实际准确度,从网上爬虫一些数据随机挑选进行的测试效果,在图5中第二张图上的牛均为犏牛,因此模型未检测出牦牛。

    4.3 未解决的问题

    由于犏牛与牦牛特征差异微小及采集数据的地方没有犏牛等因素的存在,收集到的牦牛与犏牛一起的图像数据有限,因此现模型还不能完全的区分出牦牛与犏牛的差别,还仍存在部分误检的情况。针对这种问题我们还需要增强数据收集或尝试去训练别的模型来解决现存在的问题。

    通过实验得知牦牛目标检测在YOLOv3模型上能达到90%以上的准确的率,由此可见YOLOv3能够满足高效,快速的牦牛检测需求并达到视觉检测的效果。为西藏牧区养殖业的信息化应用起到了很大的作用也验证了目标检测与识别技术在牧区养殖业中的应用有具大的前景;
    同时进一步研究牦牛的计数和进行个体识别以及行为分析也提供了方法支撑。

    猜你喜欢 幅图牦牛深度 赛牦牛(布面油画)青海湖(2022年3期)2022-06-09四增四减 深度推进快乐学习报·教育周刊(2022年16期)2022-05-01牦牛场的雪组诗滇池(2022年5期)2022-04-30深度思考之不等式新高考·高三数学(2022年3期)2022-04-28Yak of All Trades汉语世界(The World of Chinese)(2022年1期)2022-02-25美仁大草原的牦牛(外一章)散文诗(2021年22期)2022-01-12简约教学 深度学习福建基础教育研究(2019年6期)2019-05-28思维训练营发明与创新·小学生(2019年3期)2019-03-20找不同幼儿教育·父母孩子版(2018年5期)2018-11-25奇怪的影子学生天地·小学低年级版(2018年12期)2018-01-15

    推荐访问:牦牛 模型 检测

    • 文档大全
    • 故事大全
    • 优美句子
    • 范文
    • 美文
    • 散文
    • 小说文章