您的位置 首页 IOT

孤立词语音识别系统的完成

引言在孤立词语音识别中,最为简单有效的方法是采用动态时间规整(DynamicTimeWarping,DTW)算法,该算法解决了发音长短不一的模板匹配问题,是语音识别中出现最早、较为经典的一种算法。用于

引 言

  在孤立词语音辨认中,最为简略有用的办法是选用动态时刻规整(Dynamic Time Warping,DTW)算法,该算法处理了发音犬牙交错的模板匹配问题,是语音辨认中呈现最早、较为经典的一种算法。用于孤立词辨认,该算法较现在比较盛行的HMM算法在相同的环境条件下,辨认作用相差不大,但HMM算法要杂乱的多,这首要体现在HMM算法在练习阶段需求供给很多的语音数据,通过重复核算才干得到模型参数,而DTW算法的练习中简直不需求额定的核算。所以在孤立词语音辨认中,DTW算法仍得到广泛的运用。本体系就选用了该算法。

  体系概述

  语音辨认体系的典型完成计划如图1所示。输入的模仿语音信号首先要进行预处理,包含预滤波、采样和量化、加窗、断点检测、预加剧等。语音信号通过预处理后,接下来重要的一环便是特征参数提取,其意图是从语音波形中提取出随时刻改变的语音特征序列。然后树立声学模型,在辨认的时分将输入的语音特征同声学模型进行比较,得到最佳的辨认成果。

  硬件构成

  体系构成

  这儿选用DSP芯片为中心(图2),体系包含直接双拜访快速SRAM、一路AlDC/一路DAC及相应的模仿信号扩大器和抗混叠滤波器。外部只需扩展FLASH存储器、电源模块等少数电路即可构成完好体系运用。

  体系首要功能模块构成

  语音处理模块选用TI TMS320VC5402,其首要特色包含:选用改善的哈佛结构,一条程序总线(PB),三条数据总线(CB,DB,EB)和四条地址总线(PAB,CAB,DAB,EAB),带有专用硬件逻辑CPU(40位算术逻辑单元(ALU),包含1个40位桶形移位器和二个40位累加器;一个17×17乘法器和一个40位专用加法器,答应16位带或不带符号的乘法),片内存储器(八个辅佐寄存器及一个软件栈),片表里专用的指令集,答应运用业界最先进的定点DSP C言语编译器。TMS320VC5402含4 KB的片内ROM和16 KB的双存取RAM,一个HPI(HostPortInterface)接口,二个多通道缓冲单口MCBSP(Multi-Channel Buffered SerialPort),单周期指令执行时刻10 ns,带有契合IEEE1149.1规范的JTAG鸿沟扫描仿真逻辑。

  语音输入、输出的模仿前端选用TI公司的TLC320AD50C,它是一款集成ADC和DAC于一体的模仿接口电路,而且与DSP接口简略,功能高、功耗低,已成为当时语音处理的主流产品。16位数据结构,音频采样频率为2~22.05 kHz,内含抗混叠滤波器和重构滤波器的模仿接口芯片,还有一个能与许多DSP芯片相连的同步串行通讯接口。

  片内还包含一个定时器(调整采样率和帧同步延时)和控制器(调整编程扩大增益、锁相环PLL、主从形式)。TLCC320AD50C与TMS320VC5402的硬件衔接,如图3所示。

  语音辨认算法完成

  语音信号的端点检测

  语音的端点检测是语音辨认中最根本的模块,在嵌入式语音辨认体系中更是占有非常重要的位置:一方面端点检测的成果不精确,体系的辨认功能就得不到确保;另一方面假如端点检测的成果过于放松,尽管语音部分被很好地包含在处理的信号中,可是添加过多的静音则会添加体系的运算量,一起对辨认功能也有负面影响。因此为能量和过零率两个参数别离设定两个门限,一个是比较低的门限,数值比较小,对信号的改变比较灵敏,很简单就被超越。另一个是比较高的门限,数值比较大,信号有必要到达必定的强度,该门限才或许被超越:低门限被超越未必便是语音的开端,有或许是时刻很短的噪声引起的。高门限被超越,则根本坚信是因为语音信号引起的。

声明:本文内容来自网络转载或用户投稿,文章版权归原作者和原出处所有。文中观点,不代表本站立场。若有侵权请联系本站删除(kf@86ic.com)https://www.86ic.net/yingyong/iot/229525.html

为您推荐

联系我们

联系我们

在线咨询: QQ交谈

邮箱: kf@86ic.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

返回顶部