1规划摘要
现在,研讨天然化的人机交互是当今核算机科学技能范畴的首要研讨热门之一,手势输入作为一种天然、丰厚、直接的交互手法在人机交互技能中占有重要的位置。本项目提出以Xilinx公司Spartan 6系列FPGA为中心器材的手势辨认体系规划的计划,选用FPGA芯片的内置DSP硬核作为手势辨认模块的中心,担任图画辨认算法的完结,选用FPGA作为图画收集模块的操控中心,担任图画的收集,完结预处理和摄像头聚集和云台的操控作业,以FPGA高速强壮的处理才能确保了体系的实时性。手势辨认部分交融人手色彩信息和手势运动信息,运用种子算法对杂乱布景下的手势进行切割。依据切割出的手势区域大大加快了运动特征参数的提取,并结合手势区域的形状特征,树立手势的时空表观模型。辨认时,选用独立散布的多状况高斯概率模型,进行时刻规整,经过DSP和FPGA在处理不同结构算法的优势, 大大提高了手势辨认的处理速度和精确性。高速性将是该手势辨认体系最杰出的长处,可完结更高层次产品的开发并扩展运用远景。
2项目布景
研讨天然化的人机交互是当今核算机科学技能范畴的首要研讨热门之一,手势是一种天然、直观、易于学习的人机交互手法,手势输入是完结天然、直接人机交互不行短少的关键技能。现在的手势辨认技能首要分为根据数据手套和根据视觉两种。根据视觉的动态手势辨认体系更是当时科学研讨范畴的热门之一。手势输入作为一种天然、丰厚、直接的交互手法在人机交互技能中占有重要的位置。
虽然手势辨认技能的起步比较早,但绝大多数仅仅简略的停留在软件层次上,这些技能有的仅仅进行简略的比对,速度比较慢,实时性比较差,别的一些这是辨认功率较低。因而需求一个从硬件上着手,专门用来辨认手势的设备,以补偿上述两个方面的缺乏。
以现场可编程门阵列FPGA作为中心器材来完结图画的收集和预处理体系,该体系具有小型化、集成化且实时性好、灵敏性高的特色。该体系将一些单调、不杂乱、作业量大且消耗时刻的处理交给FPGA来完结,不仅能充分运用FPGA速度高的优越性,也能为DSP供给更多的时刻进行更杂乱的手势图画剖析,使得手势辨认的成果更为牢靠,提高了整个体系的功用。近几年具有乘法器及内存块资源的大容量FPGA以及根据IP核嵌入的FPGA开发技能的呈现,能够将嵌入式微处理器、专用字器材和高速DSP以IP核的方式方便地嵌FPGA,以硬件编程的办法完结高速信号处理算法。本文的意图在于怎么运用DSP和FPGA各自的优势,规划出满意实时手势辨认处理要求的硬件渠道。
总述,本文提出的高速根据DSP+FPGA架构的手势辨认体系的规划,它归纳了FPGA和DSP的长处,经过DSP和FPGA在处理不同结构算法的优势,大大提高了手势辨认的速度和精确率。
3运用远景
手势辨认技能的运用规模很广泛,首要有以下几个方面:
1、用于虚拟环境的交互。如虚拟制作和虚拟安装、产品规划等。虚拟安装经过手的运动直接进行零件的安装,一起经过手势与语音的组成来灵敏的界说零件之间的安装联系。还能够将手势辨认用于杂乱规划信息的输入;2、智能家居、多媒体设备的操控。经过手势辨认可所以运用者经过简略的清楚明了的手势对多媒体、家具设备完结操控,如开关空调、多媒体展现等;
3、用于多通道、多媒体用户界面。正如鼠标没有替代键盘,手势输入也不能替代键盘、鼠标等传统交互设备,手势十分适合于点拨、表达形状、几许改换和安装等使命。语音关于表达抽象概念及离散特色(或指令)是具有绝对优势的,并且能够触及视觉不及的方针。视野运用于人机交互在方针挑选等方面具有直接性、天然性和双向性等特色。将手势输入和这些交互通道结合,将增强现有的人机交互形式,然后完结更为直接、天然、调和的人机接口。这种多形式的人机交互技能已经成为当时研讨的热门,多通道人机界面将在可预见的将来占主导位置,并进一步促进虚拟现实技能的开展;
4、聋哑患者与正常人的沟通。手语是聋哑人运用,的言语,是由手型动作辅之以表情姿态由符号构成的比较稳定的表达体系,是一种靠动作/视觉外交的言语。手势辨认能够让机器“看懂”聋人的手语。辨认手语和手语组成相结合,构成一个“人-机手语翻译体系”便于聋人与周围环境的沟通;
4体系规划计划
经过摄像头收集手势图画,将图画数据存储到SDRAM中, FPGA处理体系经过对SDRAM的操控,完结云台操控和摄像头聚集,且将图画数据依照所需时序从SDRAM中将数据读出,并进行锐化、与布景别离、消除噪声以及等预处理,再将预处理后的数据送到MicroBlaze处理器中,在MicroBlaze处理器中对手势图画进行杂乱的手势辨认处理,完结手势切割、手势辨认,并将辨认出的手势信息实时传给FPGA,由FPGA实时显现在显现设备上。
4.1规划框图
4.2体系规划
FPGA是整个体系的时序操控中心和数据交换桥梁,并且能够完结对底层的信号快速预处理。在许多信号处理体系中,底层的信号预处理算法要处理的数据量很大,对处理速度要求很高,但算法结构相对比较简略,适于用FPGA进行硬件编程完结。而高层处理算法的特色是数据量较低,但算法操控结构杂乱,适于用运算速度快、寻址灵敏、通讯机制强壮的DSP芯片来完结。
4.2.1图画收集模块
一般固定式摄像头不能调整方向,难以对移动中的方针进行实时的抓取、捕获,不能满意本项目对手势图画收集的要求。咱们拟选用经过操控云台来完结对手势的实时精确抓取。先经过几许人脸辨认的办法辨认出方针者,然后经过调理云台上的水平与笔直两个电机来调理摄像头的方向,最大极限的收集方针者的图画,然后再经过光学变焦,使方针者明晰成像,这样能够在更大规模内取得包括手势的方针者的图画,然后能够愈加精确的提取手势图画,进行手势切割,添加手势辨认的精度。
一体化摄像机内置光学镜头,具有变倍、主动聚集功用的摄像机,其结构细巧、运用方便、监控规模广。变焦操控可完结图画的变倍、主动聚集,是一体化摄像机中的关键技能之一。步进电机可将电脉冲信号转换成角位移,每接纳一个脉冲信号就可驱动步进电机滚动一个固定视点,完结物体的精确定位,经过操控脉冲的频率可操控电机滚动的速度,步进电机已广泛运用于高精度操控体系中。一体化摄像机光学镜头中包括变倍步进电机与聚集步进电机,变倍电机滚动时,为使图画聚集明晰,聚集电机也应随之滚动,详细滚动步数与物距有关,详细参数可由镜头生产厂家供给的变焦盯梢曲线取得。为了习惯不同物距的明晰成像,变倍盯梢完毕后,合作主动聚集,以显现明晰的图画。
可经过人脸几许特征辨认算法辨认出方针者,几许特征的人脸辨认办法:几许特征可所以眼、鼻、嘴等的形状和它们之间的几许联系(如相互之间的间隔)。这些算法辨认速度快,需求的内存小,辨认率较低,可是能够满意方向调理的需求。
4.2.2 FPGA预处理模块
图画核算模块读取参数表数据,FPGA对收集模块输入并存储在外部原始图画SRAM中的原始图画数据进行核算处理,并将处理好的图画数据存储到成果图画SDRAM中,最终,FPGA内部的图画输出模块从成果图画SDRAM中将处理后的图画数据读出。