摘 要: 无人机的广泛运用,在给人们带来便当的一起,也引发了不良影响。比方,无人机飞入禁飞区引发安全问题,因为不正当的运用侵略公民的隐私等,因而需求构建一个无人机差人体系,对无人机施行监控,遏止乱飞现象。选用传统的辨认办法,灵活性缺乏,精度也不够高。为此提出一种依据深度学习的无人机辨认算法,经过练习一个依据卷积神经网络(CNNs)的学习网络,得出一个高效的辨认模型,完成无人机和非无人机间的分类。模型的测验成果表明,该办法具有较高的辨认率。
要害词: 深度学习;无人机;视觉传感网;特征提取
中图分类号: TN91
文献标识码: A
DOI:10.16157/j.issn.0258-7998.2017.07.022
中文引证格局: 蒋兆军,成孝刚,彭雅琴,等. 依据深度学习的无人机辨认算法研讨[J].电子技能运用,2017,43(7):84-87.
英文引证格局: Jiang Zhaojun,Cheng Xiaogang,Peng Yaqin,et al. A novel UAV recognition algorithm based on deep learning approach[J].Application of Electronic Technique,2017,43(7):84-87.
0 导言
无人机技能的开展十分迅速。从美军无人机的运用,到现在无人机在研讨、民用等多方面的遍及,无人机已成为一种新的潮流[1-2]。随之而来也带来许多新问题,此前无人机险撞战机事情的产生,就给人们敲响了警钟。因而,无人机差人体系的树立势在必行。本文的研讨要点为:树立视觉传感网,用于无人机的图画捕捉和信息存储;引进深度学习对无人机进行辨认,及时发现“黑飞无人机”,并采纳相应报警办法,完成对无人机的全面监管。
1 视觉传感网
整个视觉传感网(Visual Sensor Networks,VSNs)由多个节点组成,每个节点都将由摄像机阵列构成,这将作为整个体系的根底部分[3],如图1。
城市环境下一个节点的安顿示意图如图2。
为了减轻对居民的搅扰,可以修正摄像机焦距参数,然后约束摄像机的拍照规模。经过多台摄像机穿插掩盖,成功地将中心的空位区域全方位地归入监控之中。
考虑到多节点所供给的巨大数据量以及优化操控结构的需求,将数据网络规划成三层结构。坐落最底层的第三层由数量不等的节点构成一系列簇组成,每个簇内的节点统一将数据发往一台次级处理服务器。整个网络内的次级处理服务器构成网络的第二层,将数据送往坐落第一层的中心高档服务器。
2 依据深度学习的图画辨认中心
无人机差人体系中要害组成是图画辨认中心,其使命是将视觉传感网中的图画信息进行剖析和处理,从图画中辨认出无人机,然后完成对无人机的监控,归于方针辨认范畴。现在这一范畴已经有了许多的优秀成果呈现。最常见有行人检测问题,可用的特征包含:Haar、HOG、CSS、LBP等多种,这些特征表达了人体的各个重要部分,而且充分考虑了遮挡等景象。王晓刚和欧阳万里更提出了依据深度学习的行人检测手法,经过联合学习行人检测中的4个重要组成部分——特征提取、人体部件形变处理、遮挡处理和分类,最大化了各自的效果[4]。他们在传统的卷积神经网络的根底上,参加了形变处理层,终究习得的特征具有很强的判别力,优于HOG等特征。王晓刚团队的计划,是深度学习在方针辨认范畴的成功运用,给本文的研讨供给了研讨参阅。再比方人脸辨认问题[5-6],则具有更杂乱的改变,因为人脸受种族、肤色、表情、心情、光照环境、物体遮挡等许多要素的影响。推行到各种特定物体的辨认甚至场景辨认、深度学习也有许多计划[7]。因为无人机差人体系中图片信息量丰厚,且无人机的飞翔状况多样,因而辨认难度较大。为此,本文将引进深度学习算法,并以卷积神经网络作为图画辨认中心。
2.1 卷积神经网络
2006年,Hinton等人初次提出深度学习的概念[8],并敞开了深度学习的研讨浪潮,其以为:多隐层的人工神经网络可以更好地模仿人脑的考虑进程,具有愈加优异的学习才能,可以对数据进行更实质的描写,然后进步可视化或许分类的才能。
卷积神经网络是深度学习中第一个真实多层结构学习算法,其在图画辨认范畴优势显着。它使用感触野、部分衔接等概念极大地减少了参数量,降低了网络模型的杂乱度,进步了练习功率,且网络关于平移、缩放的各种变形都具有高度不变性。
卷积神经网络归于前馈多层神经网络的一种,每层由多个二维平面组成,多个神经元组成了每个平面,其结构如图3所示。
卷积神经网络使用了一系列的卷积层,降采样层构建了多层网络,来模仿人脑感知视觉信号的逐层处理机制,然后提取图画的多层次特征。
经过参加卷积层,可以完成部分衔接网络,有用减少了需求练习的网络参数。例如,对一张大的图片输入,其尺度为r×c,随机采样为a×b的小图片,假如隐含节点为k个,那么终究学习到的特征数为:
池化层是为了处理网络输出维数过大、形成分类器难以规划的问题。同样是依据核算成果的相似性原理,池化操刁难卷积得到的成果进行核算核算,减少了需求练习的体系参数。
权值更新选用BP反向传达算法。反向传达的差错可看做每个神经元的基的灵敏度(即差错E对基b改变率的偏导函数),然后使用以下关系式:
最终的分类运用了Logistic Regression扩展的一种多分类器:Softmax Regression。其体系方程及体系丢失函数分别为:
2.2 依据深度学习的无人机辨认流程
因为视觉传感网取得的一系列图画中,重视的方针或许只占其间的一小部分像素区域,又因为方针具有运动性,故在辨认中心操作之前将采纳帧差法提取感兴趣的方针,作为算法的正式输入[10-11]。二帧差法基本原理如下:
其间i(t)、i(t-1)分别为t、t-1时间对应像素点的像素值,T为阈值。
依据深度学习卷积神经网络的无人机辨认流程如下所示。
过程一:数据预处理
(1)帧差法提取方针区域;
(2)数据格局转化;
(3)预界说标签;
过程二:深度网络练习、测验
(1)构建卷积神经网络,确认网络层次结构和权重参数等;
(2)数据顺次进入卷积层、池化层、全衔接层,进行核算;
(3)选用Backpropagation Pass反向传达,进行参数调整;
(4)当差错满意或许迭代次数满意时,网络中止练习,进入Accuracy层核算准确率并输出(只在测验阶段履行,练习时不履行)。
3 辨认功能与成果剖析
首要构建了视觉传感网,设置了2个节点,现在体系仅限于白日作业。
输入2 848张图片进行练习,根底学习率设置为0.001,迭代5 000次后取得的模型用于之后的测验剖析。测验时输入712张图片,模型正确分类的景象共有634例,可得:
因为现在无人机辨认方面没有其他现成的模型可供比较,因而本文剖析了ROC曲线参数。在信号检测理论中,接收者操作特征(Receiver Operating Characteristic,ROC)是一种对灵敏度进行描绘的功用图画,该图画称为ROC曲线。运用ROC曲线来表明分类器的功能十分直观。一起为了定量且简练地表达这种功能,Area Under roc Curve(AUC)被提出。AUC的值等于ROC曲线正下方的面积,AUC的数值越大,分类器的功能越好。图4表明的是与ROC曲线制作相关的一些量,顺次为TP(True Positive)、FP(False Positive)、FN(False Negative)、TN(True Negative)。
在随机分类模型,关于任一样本输入,模型对其的猜测score是彻底随机的,假定猜测score落在区间[0,1]上,则猜测概率数学表达为:
因而本文的ROC曲线图成果如图5所示。图中整个曲线越向点(0,1)迫临,模型的功能就越好。
4 定论
本文较好地将深度学习的办法运用到了无人机差人体系这个新颖的概念上,对无人机的辨认率比较高。在网络结构的规划上,或许存在冗余,导致模型收敛速度不够快,练习功率有所丢失。后期将持续对网络结构的进行研讨,期望可以进一步进步模型的质量,并使其具有更广的适应性。
参阅文献
[1] 闫玉巧.面向无人机的自动检测体系规划与完成[D].西安:西安电子科技大学,2011.
[2] 胡占双.无人机飞翔姿势检测及操控研讨[D].沈阳:沈阳航空航天大学,2013.
[3] AHMAD N.Modelling and optimization of sky surveillance visual sensor network[D].Mid Sweden University,2012.
[4] OuYang Wanli,Wang Xiaogang.Joint deep learning for pedestrian detection[C].%&&&&&%CV,2013.
[5] Li Ming,Yu Chengyang,Nian Fuzhong,et al.A face detection algorithm based on deep learning[C].IJHIT,2015.
[6] Nagpal Shruti,Singh Maneet,Singh Richa,et al.Regularized deep learning for face recognition with weight variations[J].IEEE Access,2015,3:3010-3018.
[7] Yuan Yuan,Mou Lichao,Lu Xiaoqiang.Scene recognition by manifold regularized deep learning architecture[J].IEEE Transactions on Networks & learning,2015,16(10):2222.
[8] HINTON G E,SALAKHUTDINOV R R.Reducing the dimensionality of data with neural networks[J].Science,2006,313:504-507.
[9] SAXE A M,KOH P W.On random weights and unsupervised feature learing[C].International Conference on Machine Learing,2011:1089-1096.
[10] 王鑫.检测不规则图形的改善广义Hough改换[D].北京:首都师范大学,2012.
[11] 唐俐勒.视频监控中运动图画检测与测距技能的研讨[D].西安:西安科技大学,2010.