上海论文网是一家老字号论文网站,专业提供硕士毕业论文服务。

带注意力机制车辆目标检测和识别

日期:2020-09-23 20:16 作者:上海论文网 编辑:若诗 点击次数:120
销售价格:150 论文编号:el2020092100362920871 论文字数:4354 所属栏目:计算机论文
论文地区:中国 论文语种:中文 论文用途:硕士毕业论文 Master Thesis

本文是计算机论文,重点讲述了基于注意力机制的多尺度FasterR-CNN的构成,通过多尺度、多层级的网络设计,训练出高精度的检测网络,在设定的网络结构和数据集的基础上,进行了实验、比较和总结。

第三章简单讲述了注意力机制在自动驾驶中的应用,并重点介绍了本文在设计训练网络时参考的SSD模型。即引入上下文信息、空间注意力。主要包括以下内容:在车辆检测模型中引入上下文信息和注意力机制的相关定义,具体对SSD模型引入上下文信息融合和空间变换网络弥补缺失特征信息进行解释,以提升车辆检测性能为目标进行训练。通过迁移训练对数据集中的预训练权值进行初始化、训练和微调。最后得出结论,与现有的车辆检测算法实验相比,本文改进的模型具有一定的提升。

...

 

第一章绪论

 

现阶段车辆快速增加,道路交通系统日益复杂,智能交通系统对交通管理起到了至关重要的作用。而车辆识别与检测的准确性与高效率是智能交通系统正常运行所必需的,也是车辆检测与识别不断研究与改进的两个重要方向。识别速度快、准确率高的车辆检测系统,不仅可以监控道路交通也可以更好地做应急处理,在紧急事件中快速提取车辆信息。车辆检测在视频监控、车牌识别、无人驾驶等计算机视觉研究领域发挥着重要作用,是智能交通系统的重要环节。传统的目标检测包括三个步骤:首先生成候选区域,选取出可能的识别对象的大概位置,最初采用的是简单的穷举法;然后提取特征,提取出有效图片信息的特征数据,此时提取特征的方法与质量对后期的识别有重要作用,有的特征提取方法会提取出较细节的信息,如条纹信息,颜色变化等信息,有的则可能是图片整体性的信息;最后是将提取出的特征输入分类器,如SVM(SupportVectorMachine)等,进行分类识别。这种方法思路清晰,但此时的特征提取候选区域的产生需要大量的数据中转,而且还需要对特征进行手工的设计,容易造成耗费空间,计算时间长,特征泛化能力差等问题。由于交通系统的复杂性,开发一个强泛化算法越来越困难,深度学习中的卷积神经网络相对于传统方法的不足有着突破性的效果,对形变、光照等外界条件具有一定程度的适应性,更适宜对目标进行检测。

......
 

第二章基于卷积神经网络的车辆识别算法

 

2.1卷积神经网络
基础卷积是图像处理的重要工具,因此以卷积为基本运算形式的神经网络CNN(ConvolutionalNeuralNetworks)在计算机视觉领域中有着明显的优势,可以解决该领域复杂度较高的问题。1998年YannLeCun提出了一种基于卷积神经网络的手写数字识别解决方案,首次开启了CNN的发展。而2012年出现的AlexNet在ImageNet图像分类大赛中大放异彩,使得卷积神经网络在计算机视觉领域中备受关注,并引领整个领域的发展。卷积神经网络基本结构组成细节如下:1卷积层:表达式见1.1;卷积层对输入图像进行卷积运算的过程,通过使用卷积核对图像数据(张量)进行卷积计算,从而提取不同层级的特征,获取新特征图。卷积层有两个主要特性:权值共享与局部感知。权值共享指卷积核中的参数对于不同的输入图位置保持不变,而局部感知指卷积运算可以提取输入图像的一些初级特征(例如边缘、形状、纹理等)。
计算机论文怎么写

 

2.2CNN图像分类模型
近年来常见的CNN图像分类模型有AlexNet、VGG、Inception、ResNet等。其中ResNet能够在较深网络中避免网络退化,因此综合性能较好。本文以ResNet模型为框架,以图像为分类数据,进行有针对性的网络训练。ResNet(ResidualNeuralNetwork)是何凯明团队于2015年提出的一种网络,在同年的ImageNet图像分类大赛中利用残差块结构(ResidualBlocks)成功实现了对当时来说很深的152层网络的训练及分类。网络的效果会随着深度的增加而出现网络退化的问题。ResNet提出了残差块来构建恒等映射。残差块结构利用前馈神经网络和捷径连接,其中的捷径连接相对于初始的网络进行了恒等映射,使得数据可以执行跨层的非线性叠加,同时不会增加额外的参数,并提高了训练的速度,提升了最终效果。
计算机论文范文

.......

 

第三章注意力模型机制...............................................................................................................15
3.1深度学习中的Attention机制.........................................................................................15
3.2空间注意力机制..............................................................................................................16
3.3本章小结..........................................................................................................................21
第四章基于注意力机制的多尺度目标检测网络.......................................................................22
4.1常用深度学习目标检测算法..........................................................................................22
4.2连接模块设计..................................................................................................................27
4.3目标检测网络..................................................................................................................30
4.4实验结果与分析.............................................................................................................34
4.5小结.................................................................................................................................42
第五章总结与展望.......................................................................................................................43

......

 

第四章基于注意力机制的多尺度目标检测网络

 

4.1常用深度学习目标检测算法
目前主要的车辆目标检测算法按照stage划分,主要分为one-stage和two-stage方法。前者的代表有YOLO和SSD,该方法在图片的各个位置依次进行密集采样,采样的大小也会从小到大依次变换,然后用CNN进行回归和分类,只需要一步,因此速度显然相对较快,但这样会造成训练困难,准确度相对较低,因为正样本和负样本是完全不均衡的。R-CNN算法是后者的代表,该方法是先通过selectivesearch或者CNN产生候选框,然后对候选框利用回归和分类,该方法准确率相对较高;图4-1为上述各个算法的基本结构图:本文在现有的FasterR-CNN的基础上结合了注意力机制与多尺度,是对现有网络结构的创新性改进研究,为设计出可以进一步挖掘图片隐藏信息,提高图片遮挡等干扰因素的检测模型,对检测精度有一定提升。多尺度注意力网络的backbone采用VGG16预训练好的网络作为基础网络,整个网络架构可分为边框生成、多尺度特征融合、超参数、车辆检测等模块,如图4-10所示为算法结构流程图。其中,筛选回归框与候选框生成是同时进行运算的,可以大幅度的提升网络的运行效率以及推理速度。网络实验时的整个测试过程为:①图片输入到边框生成器做多尺度特征提取,筛选出目标样本框与删除无目标框的负样本,产生区域建议框和相应的图像坐标信息。

 

4.2连接模块设计
受DSSD和CascadeR-CNN等网络算法模型的改进思想启示,解决此问题的方法是不影响其性能指标与实时检测下,把特征提取到的语义信息进行融合,然后利用多尺度特征信息来提升性能。在原FasterR-CNN基础上加入注意力机制和多尺度信息特征融合,以此提高对小目标的检测能力,丰富其抗干扰能力。基于注意力机制和多尺度的改进FasterR-CNN算法实现的目的是:在其网络结构中,大感受野会丢失很多用的前景信息,需要保护背景中丢失的感兴趣信息,减少自然噪声的干扰,因而需要找到对应的层来做特征信息融合进行注意力机制信息判定,提高其深度挖掘隐藏图像语义的能力。然后把卷积层的conv5作为图像金字塔结构的内容,引入两个1024维的全连接层,接着再连接边框回归、分类器,这种方法能够使其推理速度更快。这样算法就结合了低层高分辨率和高层高语义信息的优点,融合不同层的特征,从而达到更好的效果。每个融合后的特征层上的预测是单独进行的。

.....

 

第五章总结与展望
本文首先讲述了关于车辆检测的研究背景和研究的必要性,并对目前国内外相关研究的情况进行阐述。介绍了车辆检测的相关背景,分析了传统车辆检测算法的基本思想和优缺点,基于深度学习的车辆检测算法的优缺点、深度学习各个相关技术的各种概念等。随后说明了本文研究课题的来源,梳理了目标检测的发展过程,对基于深度学习的车辆检测技术进行了总体描述、原理分析和实验论证,对比了传统的检测方法、改进后的R-CNN、FastR-CNN、R-FCN、FasterR-CNN、MaskR-CNN,从网络结构的异同,检测速度与效率的差别进行具体分析。经过分析采用FasterR-CNN的基础网络结构,考虑了复杂的交通场景对于车辆检测的检测效率和精确度的要求,进行了探索性创新。在模型训练时,在网络上中加入了注意力机制和多尺度特征融合。
参考文献(略)
该论文为收费论文,请扫描二维码添加客服人员购买全文。