上海论文网是一家老字号论文网站,专业提供硕士毕业论文服务。

基于卷积神经网络之图像计数研究

日期:2020-10-27 21:34 作者:上海论文网 编辑:若诗 点击次数:64
销售价格:150 论文编号:el2020102516595620995 论文字数:2970 所属栏目:计算机论文
论文地区:中国 论文语种:中文 论文用途:硕士毕业论文 Master Thesis

本文是计算机论文,本文提出了跨层连接卷积网络,提取多种尺度的人群特征。该网络串联多个基于跨层连接的卷积模块,通过低层特征复用的方式增加网络中不同尺寸感受野的数目,建模不同尺度的行人目标。为进一步使所提出的卷积网络适应人群尺度变化,一种多尺度的训练方法被提出以提升计数准确率。

本文是计算机论文,此训练算法先采用高分辨率的图像预训练网络,后采用原尺寸的图像对参数进行微调,使网络适应目标的多尺寸输入。本文在多个常用的人群计数数据集上进行了实验,实验结果验证了所提出的模型与训练算法的有效性。2.研究复杂背景干扰的人群计数问题,提出抗背景细节卷积网络与加权欧几里得损失。人群图像中的场景多变且往往包含复杂的背景成分,极易对计数算法造成干扰,影响人群目标的识别准确度。采用传统的前景提取算法由于部分细小目标难以准确分割,因而容易引入额外的计数误差。本文通过实验发现,人群图像的低频基础层主要包含背景信息,而前景人群主要位于图像细节层。因此采用人群图像细节层作为卷积网络的输入,并设计特征提取网络与密度图回归网络估计人群密度图,以缓解背景的干扰。

......

 

第1章绪论

 

本文第三章从增加感受野尺度多样性的角度出发,提出一种基于跨层连接的卷积神经网络模型。该结构串联模块化的跨层连接单元,通过低层特征复用的方式,使网络中不同尺寸感受野的数目呈指数增加,进而提取更多不同尺度的人群特征。在此基础上,一种多尺度的网络训练方法被设计用于进一步提升计数性能。多个人群计数数据集上的实验结果证明了上述结构的有效性。人群密度图是目前基于卷积神经网络人群计数算法的主要回归目标,其不仅能够描述人群的空间分布,而且对所有像素点求和便可以获得全局人数。估计密度图的质量是影响计数准确率的关键,先前的工作由于采用池化操作导致生成低分辨的密度图。本文第六章提出一种基于多层卷积特征融合的编码解码结构,旨在合并网络低层空间细节与高层语义信息,进而估计高质量的人群密度图。所提出的结构在编码器与解码器之间建立连接以融合多个层次网络特征。同时为改善特征融合流程,采用以全局上下文信息为引导的通道注意力机制,调整融合特征逐通道的响应权重。该算法能够降低计数误差提高鲁棒性,使估计密度图的质量得到提升。
计算机论文怎么写

......

 

第2章相关知识与人群计数数据集

 

2.1引言
深度学习技术应用于人群计数任务中使其性能得到了极大的提升。本章将针对本文的研究工作,简要介绍与之相关的深度学习技术,主要包括神经网络的基本原理、卷积神经网络的结构特性与层次,以及常用的人群计数数据集三个方面。无法对隐藏层的可变参数进行更新是早期神经网络陷入低潮的主要原因,BP算法的提出有效地解决了这一问题。BP算法基于误差反向传递的思想实现神经网络中的参数修正,其实质是求取期望输出与实际输出误差函数最小值的问题,通过最速下降法按误差函数梯度负方向进行参数更新。BP学习算法包括两个过程:输入信号前向传播与输出误差反向传播。输入的信号经过神经网络的逐层计算得到输出信号是算法的前向过程,反向传播时逐层求取误差函数对参数的梯度用于参数更新,该过程是通过采用复合函数链式求导法则来实现的。下面给出具体的推导过程。

 

2.2神经网络
多个神经元逐层之间相互连接组成人工神经网络,图2.5描述了一个简单的三层神经网络结构。神经网络的第一层被称为输入层,最后一层被称为输出层,输入层与输出层之间的层数不限被统称为隐藏层。隐藏层中的神经元以前一层所有神经元的输出作为输入,经过加权、求和与激活操作后将神经元的输出传递给下一层,以此完成神经网络信息前向传播的过程。神经网络的这种组织结构造就了其分布性、并行性、容错性、联想记忆性以及自适应性的模型特点。神经网络通过对每个神经元权重项与偏置项的动态调整,以达到学习输入数据与输出数据之间非线性关系的目的。相较于单一的神经元模型,多层连接为神经网络带来了更强的表达能力。
计算机论文范文

........

 

第3章目标多尺度的人群计数算法................29
3.1引言................29
3.3跨层连接卷积神经网络................32
3.4实验分析................36
3.2人群密度图................31
第4章抗背景干扰的人群计数算法................43
4.1引言................43
4.2导向滤波器................45
4.3抗背景细节卷积网络................47
第5章目标非均匀分布的人群计数算法................61
5.1引言................61
5.2二阶卷积注意力网络................62

.........

 

第6章基于多层特征融合的高质置人群密度图估计算法

 

6.1引言
非约束场景的人群通常展现出大的差异性,为准确识别带来了极大的挑战,因此有差别性的特征提取是至关重要的。为增强特征学习,密集连接空洞卷积模块被提出以充分利用网络上下文特征。DDCB由一系列密集连接的具有不同空洞率的空洞卷积层组成,不仅增大了模型的感受野而且覆盖了更大的人群尺度变化范围。空洞卷积通过在卷积核每个数值之间插入零值的方式,能够在不减小特征空间尺寸的前提下扩大感受野。然而,仅增大感受野并不足以提取区分性明显的上下文特征。因此受到具有强大特征提取能力的DenseNet启发,采用密集的方式连接空洞卷积层。

 

6.2多层特征融合网络
除了高分辨率的密度图估计作为主要的训练目标,语义分割任务被作为辅助任务用于监督上下文特征学习。此任务在DDCB输出特征的基础上粗略地将像素分为背景与人群两类。在人群计数任务中,先前的研宄普遍采用人群密度等级分类作为辅助任务,提取粗略的整体密度特征。而分割任务可以促使模型学习有差别的特征以区分背景与人群,更有助于密度图估计。本章所提出的MFFN为编码解码的网络结构,并通过在编码器与解码器之间建立连接进行多层特征融合。与用于目标检测的FPN相似,两个结构都是通过逐元素相加的方式合并低层与高层特征。但FPN仅简单地对不同阶段的特征进行求和,忽略了不同阶段特征的不一致性。融合后的特征直接被后续层所使用缺少了全局多尺度上下文信息。因而本章所提出的MFFN与FPN最大的不同在于MFFN改善了特征融合流程,对融合后的特征通道权重进行了调整。对于人群计数任务,该设计使用人群上下文信息来促进融合特征的筛选,实验结果也证明了MFFN结构设计的有效性。

........

 

第7章总结与展望
人群计数任务是智能视频监控系统的重要内容,其以准确地估计场景中的人群数目为目标,在安防预警、城市规划、交通调度与智能商业等领域有着广泛的应用。随着深度学习技术的快速发展,基于卷积神经网络的人群计数算法在降低计数误差方面取得了巨大进步。然而受到人群尺度变化、背景干扰、场景光照变化、人群杂乱分布等问题的影响,人群计数系统仍然面临着挑战。为解决上述问题,本文进行深入研宄并提出了有针对性的人群计数算法。本文的主要研宄工作可以总结分析如下:1.提出应对人群目标尺度变化的跨层连接卷积网络与多尺度的训练方法。由于成像系统的位置变化与透视效应,导致拍摄的图像中人群目标往往呈现不同的尺寸外观。同时识别不同尺寸的行人目标对一般的卷积网络来说具有较大的困难。针对此问题,此外,不同于先前计数网络采用欧几里得损失监督网络训练,本文对其进行修改提出加权欧几里得损失。
参考文献(略)
该论文为收费论文,请扫描二维码添加客服人员购买全文。