您的位置 首页 软件

根据FPGA的语音智能控制体系

语音智能操控系统可以取代多个遥控器,当需要控制某一家电时,只需说出所需调节的内容(如,空调开,温度25℃),语音智能操控系统就能通过对操控者的语音识别,完成匹配并发出遥控信息完成相应的操作。

规划摘要:

1、规划目的

科学技术水平的开展,使人们的日子遭到耳濡目染的影响,并逐步改动人们的日子习惯,不断地进步人们的日子质量。比方因为全主动洗衣机、微波炉等智能化设备的呈现,咱们不用按键控制每一步进程,机器能够主动完结整个进程,用户也能够遥控他们。

智能化所带来的便利、便利带给人们愈加舒适的日子,可是跟着家用电器的不断增多,需求的遥控器也不断增多,给人们形成许多的不便利,因而,一种能够解放人们双手并且实时、快速、便利的语音智能控制体系的概念应运而生。语音智能控制体系能够替代多个遥控器,当需求控制某一家电时,只需说出所需调理的内容(如,空调开,温度25℃),语音智能控制体系就能经过对控制者的语音辨认,完结匹配并宣布遥控信息完结相应的操作。

根据FPGA完结语音智能控制体系具有:

(一)规划灵敏、操作便利、便利

(二)准确度高,作业规模大

(三)可随时用语音控制带有遥控设备的用电器

(四)可扩展性强,增强了体系的外接功用

(五)便于更新和体系晋级,可随时嵌入更新体系程序

(六)规划周期短、开发费用低、功耗低一级共同长处。

2、适用规模

语音智能控制体系首要控制的家用电器有两类,第一类是开关型家电,包含家居照明、饮水机、电饭煲、抽风机、充电器、电风扇等;第二类是红外遥控型家电,包含空调、电视机、DVD、电动窗布、电动闸口等。还有许多有待开发的应用领域,规模很广。

3、主板

该体系运用FPGA板块,可自主嵌入应用程序,用户可根据自己需求植入语音信息,以待匹配。假如用户不需求某项语音匹配信息,可删去,灵敏性十分高。一起,由FPGA主板规划ASIC电路,具有规划周期短、开发费用低、功耗低的长处。体系控制中心都在FPGA内部完结,能够极为便利的更新和晋级体系,大大的进步了体系的通用性和可进步性。

功用描绘:

由FPGA完结语音智能控制体系的体系构架图如图2-1所示,它是以FPGA为主板,嵌入语音辨认体系并结合红外遥控体系完结的智能控制体系。

图2‑1 由FPGA完结语音智能控制体系的体系构架图

FPGA中嵌入的语音辨认体系分为两种作业方式:练习方式和辨认方式首要,用户在练习方式下,完结相应的语音信息的输入和特征存储作业,树立完好的语音信息特征数据库。然后,在辨认方式下,由语音输入设备输入语音信息进行比对,匹配后即宣布相应操作的信号,遥控设备。体系框图如图2-2所示

图2-2 语音辨认体系的框图

该体系分为五个模块:语音信息特征提取模块、语音信息特征数据库树立模块、语音信息输入收集与预处理模块、语音信息比对模块、控制指令衔接发送模块。

1、语音信息特征提取模块,即对接收到的语音信息经过语音辨认算法提取相关特征匹配数据,其间用到语音信息输入收集模块。

2、语音信息特征数据库树立模块,即对特征提取模块所得匹配数据存储到存储器中,以备比照匹配运用。

3、语音信息输入收集模块,即经过麦克风输入语音信息,当满意要求时,经过信息特征提取模块对输入的语音信息的特征数据进行提取,保存到缓冲区,等候比照。

4、语音信息比对模块,即用保存到缓冲区的特征数据和数据库中的数据进行比对,是否与某一数据匹配。

5、控制指令衔接发送模块,即当输入的语音信息与某一库存信息匹配时,就完结主板与红外发射设备的衔接并宣布相应的操作指令信息,完结操作。

整个进程由嵌入到FPGA芯片内的程序完结。别的,根据NiosII的SOPC体系协助咱们完结了上述功用。一起,咱们经过开发东西SOPC Builder,在FPGA上创立软硬件开发的根底渠道,能够很快的将硬件体系(包含处理器、存储器、外设接口和用户逻辑电路)与惯例软件集成在单一可编程芯片中。并且,SOPC Builder 还供给了规范的接口办法以便咱们将自己的外围电路做成Nios Ⅱ软核能够增加的外设模块。这种规划办法愈加便利了咱们对体系的调试。

性能参数:

  1. 体系的性能参数:

麦克风参数:

灵敏度:-34~2dB(0dB=1V/Pa at 1kHz)

频率响应:20Hz~20KHz

阻抗:50Ω±30% (at 1kHz) 负载阻抗:≥1000Ω

等效噪声级:13/14/15dB

信噪比:81/80/79 dB

最大声压级:135dB (at 1kHz≤1% T.H.D)

耗电电流:3mA

2、 作业环境:

作业温度:

相对湿度:

3、 通信协议参数:

波特率:9600bit/s;开端位;1bit;

数据位:8bit; 中止位:1bit.

4、 算法参数:

5、 耗时:

6、 体系资源运用状况:

规划结构:

本规划以FPGA 系列Spartan-6开发板为规划渠道,开发板、麦克风、红外模块组成完好的硬件渠道,整个体系简练漂亮,无凌乱的连线,体系中语音收集和控制输出由外围设备完结外,其他部分处理全部有FPGA系列Spartan-6完结。图4-1为根据FPGA完结语音智能控制体系硬件规划图。

图4-1 根据FPGA完结语音智能控制体系的硬件规划图

体系上电后,软件即开端运转一系列初始化程序完结体系的初始化作业,然后要求用户挑选作业方式,作业方式分为练习方式和辨认方式,方式的挑选由用户经过主板的按键进行,若不挑选,则默以为进入辨认方式。下面是这两种作业方式软件流程的扼要阐明。图4-2是语音智能控制体系总体规划流程图。

图4-2语音智能控制体系总体规划流程图

练习方式:在该方式下,对语音信息进行练习(便是把所用到的方针语音信息特征数据进行存储,树立数据库)。进入练习方式后,用户根据指示灯的提示,输入相应的语音信息,核算机内部程序对输入的语音信息进行特征提取并将特征数据存入缓冲区,每一遍提取后都会进行检测,判别是否充沛,若不充沛,回来上一单元持续提取,直到充沛停止。然后进行数据存储,将存入缓冲区的数据存入存储器中。体系宣布提示是否持续练习,用户根据主板的指示灯,经过按键挑选,若完毕练习,体系回来方式挑选单元,完毕练习。

辨认方式:在辨认方式下,用户输入语音指令信息,体系检测是否满意辨认条件(比方是否是正常的语音信号),然后进行特征数据提取,整个进程和练习方式中的相同,提取后再进行匹配,在数据库中寻觅与提取的特征数据相匹配的数据。若没有找到,则回来输入单元,持续输入;若找到匹配后,进入下一单元。根据存储的特征数据在体系中找到相应的操作指令,衔接红外发射设备,宣布控制指令信号,控制其他设备。完结之后,回来方式挑选单元。

规划办法:

本体系规划开发中首要运用的硬件东西和软件设备:

Spartan—6、音频编解码芯片、麦克风、ISE仿真软件。

以下分模块介绍所用算法:

5.1语音信息输入收集与预处理模块

本模块要完结的功用是收集语音信号,并对其进行FIR滤波、语音数据归一化、语音的端点检测处理。语音收集部分选用外加的音频编解码器进行规划,经过VERILOG HDL编写对芯片的作业方式进行设置,是芯片在上电后对作业方式设置在体系要求的状态下。

语音预处理包含三部分,语音归一化处理单元、FIR滤波器运算单元、语音端点检测单元。图5-1.1是预处理的结构功用图:

图5-1.1预处理的结构功用图

在剖析处理之前有必要进行端点检测进程,以确认语音信号的开端点和完毕点。其间包含对语音信号短时能量和短时过零率的剖析。

短时能量

其间,为原样本序列在窗函数所切取出的第n段短时语音,N为帧长。

短时过零率

其间,为符号函数。

图5-1.2语音的端点检测状态图

5..2语音信息特征数据的提取模块

这儿运用到MFCC音频特征提取算法,语音信号输入体系后,先进行加窗、滤波等预处理,再进行采样等进程,终究完结特征数据的提取。在辨认方式下,语音信息的收集也是用到了这个算法,进程相同。

MFCC算法是有用的根据内容的音频特征提取算法,其处理进程如下:

(1) 对音频信号进行预处理,即预加剧、分帧、加窗处理;

(2)将每帧音频信号进行傅里叶改换得到其频谱:

(3)用Mel滤波器组在频域进行带通滤波,并对每个频带的能量叠加得到频谱能量x(k);

(4)将滤波器组的能量取对数,然后做离散余弦改换,即得到MFCC特征。

图5-2为MFCC特征提取算法的流程图。

图5-2 MFCC特征提取算法的流程图

核算公式为:

此刻所提取的特征为音频信号的静态特征,该信号再经一阶差分后即得到音频的动态特征。

5.3 特征数据匹配模块

完结特征数据提取后,体系需求完结匹配的进程,这儿用到了DTW算法,即在数据库里重复寻觅与输入的音频特征不同最小的数据信息,完结匹配。

DTW算法是典型的DP人算法,它运用动态时刻规整办法将模板特征序列和语音特征序列进行匹配,比较二者之间的失真,得出辨认判定的根据。DTW算法的详细进程如下:

假定存储的一个词条模板包含M帧倒谱特征R={r(m);m=1,2,…,M};辨认特征序列包含N帧倒谱特征T={t(n);n=1,2,…,N}。在r(i)和t(i)之间界说帧部分失真D(I,j),D(I,j)=|r(i)-t(i)|*2,经过动态查找途径中找到的累积失真最小的途径,即最优的匹配成果。选用对称方式DTW:

其间S(i,j)是累积失真,D(i,j)是部分失真。

当动态规划进程核算到固定节点(N,M)时,能够核算出该模板动态匹配的归一化间隔,辨认成果即该归一化间隔,最小的模板词条

核算进程中,为了削减核算量,咱们采纳以下办法:

大局途径束缚,即只核算四条直线:y=0.5x,y=2x,y=0.5x+(M-0.5N)

,y=2x+(M-2N)所谓的平行四边形内部的点;

端点束缚为固定起点、结尾,即从左下角开端核算,到右上角点截止;

对进行方式匹配的两条语音指令的长度N和M进行了束缚,假如两者之间相差太大则直接抛弃该参数模板,不进行DTW运算。

图5-3 DTW算法流程图

规划特色:

该规划的首要特色:

该规划选用MFCC音频特征提取算法和DTW特征匹配算法,对音频进行了加窗、滤波预处理,特征数据的提取和比对都比较准确,体系的稳定性和准确性都得到了进步。

体系选用Spartan-6主板,将程序编写后嵌入到芯片内部,外部仅仅选用简略的线,用于衔接输入、输出设备,主板选用%&&&&&%,削减了连线过错的可能性。一起,内嵌的程序可作修正,更具有用性,也节约了制造资料。

当体系呈现过错时,可调出内部程序,在仿真软件上进行模仿查询过错;若问题出在外部电路,因为电路连线简略,用户便于查找和更改。比较于单纯的电路结构,该体系结构明晰,无需大规模的改动,愈加有用和节约资料。

体系选用红外模块控制家电设备,结构简略,控制便利。

红外控制自身就具有可遥控的特色,即芯片可固定于某一方位,衔接多个红外发射端口,就可完结对多个设备的控制。

声明:本文内容来自网络转载或用户投稿,文章版权归原作者和原出处所有。文中观点,不代表本站立场。若有侵权请联系本站删除(kf@86ic.com)https://www.86ic.net/qianrushi/ruanjian/199440.html

为您推荐

联系我们

联系我们

在线咨询: QQ交谈

邮箱: kf@86ic.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

返回顶部